perlのHTML::Parser
メモ書き程度ですみません。
今のところ一番参考になってるサイト。
http://soft.bko.to/perl/H-J/HTML-Parser.html
始めはこのサイトの意味がぜんぜん分からなかったのですが、いじってるうちにダイブ分かってきました。
http://blog.yshh.jp/2009/02/14/htmlparser%E3%82%92%E3%82%AA%E3%83%96%E3%82%B8%E3%82%A7%E3%82%AF%E3%83%88%E6%8C%87%E5%90%91%E3%81%A7/
そもそも start とか end とか text といったメソッドが、parseの中で呼ばれる特殊なメソッド。
そして、それらをオブジェクト指向的にオーバーライドしてやることで、独自のparserにロジックを産めることができると。