2017年11月29日 / 最終更新日時 : 2017年12月18日 gswk 業務日記 [PC] .NET用Luceneのユーザー辞書~FlexLucene v6.3.0及びLucene.Net v4.8 beta~ ユーザー辞書の利用 以前、.NET(C#)でLuceneを使用する方法として、FlexLuceneを使う方法と、Lucene.Netを使う方法とがあることを紹介しました。そして実際に使ってみると既定の辞書では少し物足りな […]
2017年11月28日 / 最終更新日時 : 2017年12月18日 gswk 業務日記 [PC] Lucene.Net Ver. 4.8.0 beta-00005 ~Lucene.Netでインデックス作成してみる~ Lucene.Netでインデックス作成 Lucene.NetがJapaneseAnalyzerに対応したということで、早速インデックスの作成プログラムを書いてみました。まずは、Visual Studio Communit […]
2017年11月24日 / 最終更新日時 : 2017年12月18日 gswk 業務日記 [PC] Lucene.NET Ver. 4.8.0 beta-00005 ~Luceneの.NETへの移植版がKuromoji対応になる~ Lucene.NETのベータバージョンアップ ほぼ2ヶ月前に記載させてもらったFlexLuceneを見つけた経緯の中で、Lucene.NETがJapaneseAnalyzerに対応していない旨を記載しました。 https […]
2017年11月22日 / 最終更新日時 : 2017年12月18日 gswk 業務日記 [PC] FlexLuceneのメモ書き~IndexWriterConfigOpenModeとGetLiveDocsと~ FlexLuceneのメモ書き(その1) FlexLuceneを使っていて、気づいたことを書き残しておこうと思います。 IndexWriterConfigOpenMode Fieldを作る際に用いたStringField […]
2017年10月26日 / 最終更新日時 : 2017年12月18日 gswk 業務日記 [PC] TikaOnDotNetとxdoc2txtと比較〜自分が使いたいことを基にしたとても簡単な比較〜 TikaOnDotNetとxdoc2txtとの比較 つい先日知ったTikaOnDotNetと、xdoc2txtとの対比を行ってみました。視点が偏っているかもしれませんので参考までにご覧ください。 比較表 長所 短所 T […]
2017年10月25日 / 最終更新日時 : 2017年12月18日 gswk 業務日記 [PC] TikaOnDotNetでテキスト抽出〜Apache Tikaを.NET Frameworkで使ってみる〜 TikaOnDotNet FlexLuceneの活用方法を探してLuceneのホームページを見ていたらTikaという文書テキスト抽出ソフトがあることに気づきました。どうやらTikaは、Luceneを使っている人には有名の […]