2009-07-18から1日間の記事一覧

いもげスレtoXML

PHPとPythonの勉強を兼ねて、id:vert771さんのコード(http://imgscraper.sourceforge.jp/)をPython(3.1)に置き換えて見た。 正規表現とか文字コードとか色々適当です。うげえ。 きっともっと効率のよいやり方があるはず。あと'>'の処理も適当。本文抽出も適…

Cuda

Cuda + OpenCV + C++/CLIで開発・・・は辞めたほうがいいのかな? せめてネイティブにしたほうがいろいろ楽な予感

HTMLタグを取り除く

http://www.codereading.com/codereading/python/strip-html-tags.html ここを参考にしてHTMLタグを取り除こうと思ったら、Python 3.x系からはsgmllibが無くなってるみたいなので少し書き換え。といってもライブラリのところを置換しただけですが。 import h…