2008-09-21から1日間の記事一覧

JRubyとPOIを使ってMS Officeのテキストを抜き出すライブラリを作りました

仕事で必要になりそうな気配がしてきたので、夏休み中にMS Officeドキュメントに含まれるテキストを抽出するためのツールを作ってみました。 DeltaAttackという名前でGitHubで公開しています。http://github.com/moro/delta_attack/tree/master最初はxlhtml…