2ちゃんねる ★スマホ版★ ■掲示板に戻る■ 全部 1- 最新50  

■ このスレッドは過去ログ倉庫に格納されています

組み込み型全文検索エンジンSenna

1 :うんこ船長:2005/06/15(水) 00:14:13 ID:nYzPplAZ
ないようなので立ててみました。

http://dev.razil.jp/project/senna/

2 :うんこ船長:2005/06/15(水) 00:15:27 ID:nYzPplAZ
関連スレッド

Namazu全文検索システム
http://pc8.2ch.net/test/read.cgi/php/992477868/

3 :nobodyさん:2005/06/15(水) 00:16:17 ID:nYzPplAZ
…で、どうやって入れたらいいねん
誰か教えてくれ!

4 :うんち船長:2005/06/15(水) 00:22:15 ID:nYzPplAZ
入れ方はこうらしい。

http://qwik.jp/senna/8.html

5 :nobodyさん:2005/06/15(水) 05:04:00 ID:I3ZAfTjX
これはもしかして
今のところRubyのみ?

6 :nobodyさん:2005/06/15(水) 07:36:18 ID:???
PerlとMySQLのバインディングもあるよ。
はてなで使ってるのはそれか、さらにカスタムしてるかも。

すごい使い勝手はよさそうなんで、PHPとPostgreSQLのバインディングもよろしく。<ブラジルの中の人
いざとなれば、他のPECLの見様見まねで自分でPHPバインディングつくるかも。

7 :nobodyさん:2005/06/15(水) 13:39:14 ID:???
GPLのライブラリはPHPライセンスと衝突するからまずいという議論が
php-dev であったよ。それで Rast のモジュールもお蔵入りになり、
namazu も pecl から撤退した。

8 :nobodyさん:2005/06/15(水) 15:22:53 ID:???
やっぱりGPL絡みで本家に期待するのは難しいですね。
自分でコソーリ作ってコソーリ使うか。

Namazuは将来libnmzをLGPLにするという話があるみたいだけど
分かち書きインデックスの精度に限界を感じてるので、それでPECL復帰しても使うかは微妙。
RastかSennaがいいなあ。

しかしEstraierも含め国産全文検索エンジンは何で揃いも揃ってGPLなんだろ。
コアがLGPL/BSDLで、フロントエンドの実装がGPLなら、ぐっと使いやすくなるのに。

# Namazuを引き合いに出すけど、わざわざLGPL版を書き起こさなくてもソースコードの著作権者が
# 「LGPLにライセンス変更です」って宣言すればいいだけと思う。

9 :nobodyさん:2005/06/15(水) 16:32:48 ID:???
Estraier はコアのLGPLであるところのQDBMライブラリのGPLな全文検索
フロントエンドな訳だけどね。
モジュールが書ける腕なら同等機能を作るのは問題ないはず。ソース見てみ。

Rast も XMLRPC 経由で使えばライセンス問題は起きないから、
仕様が公開されれば php からも使えるでしょ。

あと、Estraier の次バージョンの HyperEstraier はライブラリ形式で LGPL。


著作権者って送ったパッチが取り込まれた奴全員だよ?
一人でもヤダっていったらダメな訳だし、そもそも連絡取れないとおもう。

10 :nobodyさん:2005/06/18(土) 17:36:37 ID:???
msearchで十分だなー…。
http://www.kiteya.net/script/msearch/

11 :nobodyさん:2005/07/03(日) 21:05:39 ID:???
>>8
まだ見てるかな。
Rast がライセンス変更になったよ。BSDライクな奴だってさ。
そんで、phpモジュールも公開再開だって。

個人的には、そろそろ公開されそうなHyperEstraierのノードAPIに
期待してるわけですが。

12 :nobodyさん:2005/07/06(水) 14:14:43 ID:???
sennaもLGPLになりましたよ

13 :nobodyさん:2005/07/07(木) 14:39:25 ID:???
APIを見ると、文書の属性は保存できないんだね。
まぁべつのBDBなりなんなりに入れろということか。

文書管理の面からすると、RastとかHyperEstraierに比べてそのへんが面倒?
逆に文書管理に縛られずに自由にいろんなアプリに組み込めるのがいいところなのかな。

14 :nobodyさん:2005/12/08(木) 05:44:00 ID:???
独自パッチバージョンのMeCabが必要という時点で、
お試しで軽く触ろうという意欲が無くなるな。
sennaにしか効果ないパッチじゃなく、MeCab全体に役立つパッチとして
MeCab公式に取り込んでもらいたいところだな。


15 :nobodyさん:2005/12/18(日) 21:36:06 ID:RgxCfVuV
使ってみるか

16 :nobodyさん:2006/02/15(水) 19:47:18 ID:ZxB9YIqX
保守

17 :nobodyさん:2006/02/16(木) 17:00:42 ID:i7JO7WUs
>>14
MeCab0.9で取り込まれたっぽいからpatchはもういらないぽ

18 :nobodyさん:2006/06/21(水) 02:12:06 ID:I+o61wNk
sennaのMLのログ見てたら
ひろゆきの投稿発見した
http://lists.sourceforge.jp/mailman/archives/senna-dev/2005-October/000140.html
ひろゆきって自分で鯖いじったりもしてたのね

19 :nobodyさん:2006/06/22(木) 01:32:26 ID:???
雑誌記事が追加されてるな。
http://qwik.jp/senna/publication.html

20 :nobodyさん:2006/06/22(木) 15:24:11 ID:+CxY78Dt
MySQLバインディングのところ、
「skipmode-patchについてはここでは触れません。」
って書いてるけど、
どこで触れてるの?

21 :nobodyさん:2006/06/22(木) 17:28:13 ID:???
http://lists.sourceforge.jp/mailman/archives/senna-dev/2006-March/000208.html

発見した。
「limitで指定されたoffsetまで冗長なIOを抑止する」んだね。
で、2ndパッチを当てたら特にはいらないと。

22 :nobodyさん:2006/06/22(木) 21:44:13 ID:???
なんでこのスレ書き込み少ないん?
普通に便利だと思うんだが…

23 :nobodyさん:2006/06/23(金) 15:51:45 ID:???
>>22
使用する機会が少ないから。

ホームページならGoogleでいいし、blogなどの検索機能でも十分だし。
それ以外ではSQLのlike検索で十分なパフォーマンスになる程度の量しかない。

24 :nobodyさん:2006/07/30(日) 14:02:34 ID:zmnCWUN9
PHPでSennaを使ってHTMLを検索するときに、インデックス生成はどうやってやればいいんでしょうか?
MySQLを使用したものしか製作したことがないので…

25 :nobodyさん:2006/07/30(日) 20:10:49 ID:???
>>24
PHP bindingを使う、
http://qwik.jp/senna/PHP_binding.html
のだが、PHPバインディングの開発は止まっているみたい。

26 :nobodyさん:2006/08/01(火) 13:27:49 ID:???
>>24
これって24さんかな?
http://xoopscube.jp/modules/xhnewbb/viewtopic.php?topic_id=3443&post_id=14886


27 :nobodyさん:2006/08/03(木) 22:25:33 ID:???
>>22
Mysqlの全文検索がUTF8対応だからじゃないかな
N文字でも分かち書きでもいいけどとにかく適当に分割してやれば日本語でも検索できる
じゃあSennaって?ていう感じじゃないだろうか

28 :nobodyさん:2006/08/19(土) 12:09:09 ID:???
っていうか2ch絡みの企業の製品なんて使いたくもない。

29 :nobodyさん:2006/11/01(水) 16:19:47 ID:???
Lucidaって中身sennaだったんだね

30 :nobodyさん:2006/11/01(水) 19:41:42 ID:???
それをいうならLudiaだろ・・・

31 :nobodyさん:2006/11/02(木) 19:03:56 ID:???
>>http://pc8.2ch.net/test/read.cgi/php/1157467026/382
>382 名前:nobodyさん sage 投稿日:2006/10/05(木) 14:59:05 ID:???
>MySQLならMeCabとかで分かち書きして、UTF-8でFULLTEXTに放り込む手もある。


こんな事を書いてたら某所で取り上げられてて驚いた。(適当に要約し引用)
>MySQL&PostgreSQLの全文検索は転置インデックスだが、Sennaは完全転置インデックスを採用している。
>完全転置インデックスの採用によって、Sennaはフレーズ検索する事ができる。

>>27
フレーズ検索に対応ってのは結構大きなポイントだねぇ

32 :nobodyさん:2006/11/02(木) 21:25:40 ID:???
>>30
間違えた

33 :nobodyさん:2006/11/02(木) 21:58:41 ID:???
素直な30に萌えた。

34 :nobodyさん:2007/02/23(金) 18:48:38 ID:YFrEMN+P
1.0完成記念age!
少し前の使ってるけど
入れ直した方がいいのかな?

35 :nobodyさん:2007/02/24(土) 01:43:06 ID:???
>>25
期待していい?

36 :nobodyさん:2007/02/24(土) 21:56:13 ID:5ktSNz/w
>>34
入れなおして、インデックスを作りなおすといいかも。
安定性が増している・・・はず・・・

37 :nobodyさん:2007/02/28(水) 00:12:15 ID:???
phpバインディングまだぁ?

この前、ぐにゃらくんが PHP extensionの書き方勉強してるっていうんで
期待してたのだけれども。


38 :nobodyさん:2007/02/28(水) 02:15:14 ID:???
>>37
rm -rfで書き途中のヤツを消してしまった。
今は書き直して、basic APIまでできてる。

39 :nobodyさん:2007/02/28(水) 02:27:09 ID:???
大量のデータをDBも使わずにいじるケースが想像しにくいんだけど
PHPバインディングってどういう用途で使うの?

40 :nobodyさん:2007/02/28(水) 03:35:07 ID:???
>>39
んだ。特に今のSennaはストレージを持っていないから、
ドキュメントの更新は古いドキュメントの内容を渡さないといけない。
となると、実用的なアプリを書くとなると、
やはりBDBとかsqliteに別途ドキュメント情報を持っておく必要があると思うんだけどなあ・・・

9 KB
■ このスレッドは過去ログ倉庫に格納されています

★スマホ版★ 掲示板に戻る 全部 前100 次100 最新50

read.cgi ver 05.02.02 2014/06/23 Mango Mangüé ★
FOX ★ DSO(Dynamic Shared Object)