2ちゃんねる ★スマホ版★ ■掲示板に戻る■ 全部 1- 最新50  

■ このスレッドは過去ログ倉庫に格納されています

SpamAssassin

1 :名無しさん@お腹いっぱい。:2005/08/23(火) 13:55:32
apache.orgの傘下になって、ますます勢いづくスパムメールの暗殺者
SpamAssassin
これでSPAM業者を失業に追い込もう.......
とまでには、まだまだ遠い道のりだよ(w
学習しろ!!学習しろ!!学習しろ!!
sa-learn --spam --mbox /home/hiroyuki/mail/spam

ハムをスパムと間違えないで、一生のお願いだから。

スパム業者の荒らしはスルーってことで。
おまいら、まったりとお願いします。

本家 ttp://spamassassin.apache.org/
2005-06-06: SpamAssassin 3.0.4 released!

キーワード
local.cf
user_prefs
spamassassin
ベイズ推定
ベイジアンフィルタ
ホワイトリスト
AWL
bayes_journal
auto-whitelist


2 :名無しさん@お腹いっぱい。:2005/08/23(火) 13:56:11
ググル SpamAssassin
http://www.google.com/search?as_q=SpamAssassin&num=100&hl=ja&ie=Shift_JIS&btnG=Google+%8C%9F%8D%F5&as_epq=&as_oq=&as_eq=&lr=lang_ja&as_ft=i&as_filetype=&as_qdr=all&as_occt=any&as_dt=i&as_sitesearch=

関連スレ
http://www.google.com/search?as_q=spamassassin&num=100&hl=ja&ie=Shift_JIS&c2coff=1&btnG=Google+%8C%9F%8D%F5&as_epq=&as_oq=&as_eq=&lr=lang_ja&as_ft=i&as_filetype=&as_qdr=all&as_occt=any&as_dt=i&as_sitesearch=2ch.net

3 :名無しさん@お腹いっぱい。:2005/08/23(火) 14:17:10
なんでunix板なんだろうという素朴な疑問は却下ですか

4 :名無しさん@お腹いっぱい。:2005/08/23(火) 14:23:50
↓こっちで十分だろうという素朴な疑問は却下ですか

メールサーバ迷惑メール対策スレ
http://pc8.2ch.net/test/read.cgi/unix/1124090297/

5 :名無しさん@お腹いっぱい。:2005/08/23(火) 14:26:08
Internet Mail System スレって落ちたんだっけ

6 :名無しさん@お腹いっぱい。:2005/08/23(火) 14:31:04
みたいだね。立てちゃっていいんじゃないかな。

7 :名無しさん@お腹いっぱい。:2005/08/23(火) 14:51:41
http://pc8.2ch.net/test/read.cgi/pc/1097383368/l50

8 :名無しさん@お腹いっぱい。:2005/08/23(火) 15:59:57
SpamAssassinは「メールテキスト(ヘッダと本文)分析、
ベイジアンフィルタ、DNS blocklists、
および共同型フィルタリングネットワーク」
を使用する事でスパムを特定するメールフィルタです。

DNS blocklistsは、spamを発信もしくは
中継するサーバのIPアドレスのブラックリスト、
及び、spamの本文中にある、spammerが誘い込もうとする
web サービスのURI 文字列から、
ドメイン名を抽出したブラックリストを利用します。
共同型フィルタリングネットワーク
(collaborative spam filtering network) は、
メールの本文から「署名」を検出し、これをサーバに登録されている
spamの「署名」と照合し、合致していればspamと判定する、というものです。

(参考)
ttp://tlec.linux.or.jp/docs/spamassassin.html

9 :名無しさん@お腹いっぱい。:2005/08/23(火) 16:01:46
>>1をフィルタしたいです。

10 :名無しさん@お腹いっぱい。:2005/08/23(火) 17:51:29
sperm ass ass in

11 :名無しさん@お腹いっぱい。:2005/08/23(火) 17:54:26
スパム 朝 死んだ

12 :名無しさん@お腹いっぱい。:2005/08/23(火) 17:55:52
Mail-SpamAssassin は razor-agents と組み合わせて
使うとかなり強力だよね。

13 :名無しさん@お腹いっぱい。:2005/08/23(火) 18:18:11
SpamAssassinの設定ファイルは、3種類あります。
以下のディレクトリのパスの記述は、正確には
OSもしくはディストリビューションのmanを参考にして下さい。


- /usr/share/spamassassin/*.cf:
デフォルト設定が記述されています。
バージョンアップにより、書き換えられるので、
変更しない方が良いでしょう。

- /etc/mail/spamassassin/*.cf:
サイト全体の設定を記述します。

$USER_HOME/.spamassassin/user_prefs:
各ユーザー自身の細かい設定が出来ます。
例えばサイト設定でスパム指定されているドメインからのメールでも、
ユーザが希望すれば、受信する事が出来ます。
ただし、サイト設定でuser_prefsの使用が
有効になっている必要があります。


14 :名無しさん@お腹いっぱい。:2005/08/23(火) 18:46:41
D_BOUNCEとD_REJECTの違いがわかりません
おしえてくださいませ

15 :名無しさん@お腹いっぱい。:2005/08/23(火) 19:11:58
要は >>1 == >>14 の単発質問スレだったのか。

16 :名無しさん@お腹いっぱい。:2005/08/23(火) 19:36:38
OSもしくはディストリビューションのman

17 :名無しさん@お腹いっぱい。:2005/08/23(火) 22:43:22
bsfilterのほうが好きです

18 :名無しさん@お腹いっぱい。:2005/08/24(水) 00:42:51
導入してすぐに、部署が違う顔なじみのお姉様達に、
迷惑メール減らしてくれてありがと〜と誉められました。
なんかうれしかった。

19 :名無しさん@お腹いっぱい。:2005/08/24(水) 01:02:26
>>14

# Notes:
# D_REJECT and D_BOUNCE are similar, the difference is in who is responsible
# for informing the sender about non-delivery, and how informative
# the notification can be (amavisd-new knows more than MTA);
# With D_REJECT, MTA may reject original SMTP, or send DSN (delivery status
# notification, colloquially called 'bounce') - depending on MTA;
# Best suited for sendmail milter, especially for spam.
# With D_BOUNCE, amavisd-new (not MTA) sends DSN (can better explain the
# reason for mail non-delivery, but unable to reject the original
# SMTP session). Best suited to reporting viruses, and for Postfix
# and other dual-MTA setups, which can't reject original client SMTP
# session, as the mail has already been enqueued.

20 :名無しさん@お腹いっぱい。:2005/08/24(水) 11:22:12
>>18
雑誌の裏表紙広告のようでワロス

21 :名無しさん@お腹いっぱい。:2005/08/24(水) 16:03:20
>>19 すみません。違いが良く解りません。エロイ人、解説して。

22 :名無しさん@お腹いっぱい。:2005/08/25(木) 21:25:38
>>8 ここの設定ファイル、まめにアップしてくれるので
非常に参考になります。
日本語のスパム排除に効果アリアリです。


23 :名無しさん@お腹いっぱい。:2005/08/26(金) 14:49:37
>>14 >>19

D_REJECT 発信元のsmtpにrejectする。もしくはDSNを送る。
(MTAによってことなる。)

D_BOUNCE DSNを送る。

24 :名無しさん@お腹いっぱい。:2005/08/29(月) 19:32:07
入れると動作おもくね?

25 :名無しさん@お腹いっぱい。:2005/08/30(火) 15:51:44
>>24
アルバイトでもしなさい。

26 :名無しさん@お腹いっぱい。:2005/08/31(水) 17:58:36
>>24 ハム3000通読ませたら、落ちたyo。ちょっとずつ読み込ませろ。

27 :名無しさん@お腹いっぱい。:2005/09/08(木) 14:33:13
デーモンとしての動作なら大丈夫らしい。
ハムスパムの読み込ませは、パワーいると思う。

28 :名無しさん@お腹いっぱい。:2005/09/09(金) 05:55:47
>>26
頼まれて作ったサイトの最初の学習用に、取れ立てspamを一気に
一万ファイル読ませたけど、大じょぶだーたよ。

途中で裏にまわしちゃったので、正確にはわからないけれど
一時間以上はかかったと思う。Debian Sarge/i386でRAM512MB、
SAは3.0.3。Maildir形式。

若干オフトピになるかもしれないけれど、参加者が
いるかもしれないので聞いてみる。
RBL.JPのメーリングリストって活発ですか?。流量は?。
一時停止のお知らなどの運用状況『も』流れたりします?。

仕事でも個人でもspammerには頭来てるんで、暇な時は
(RBL.JPとは他所のところに)spam報告してるんだけれど、
RBL.JPにも入ってみようかと思っているんだが、どんな様子なのだか、
聞いてみるテスツ。

29 :名無しさん@お腹いっぱい。:2005/09/13(火) 00:27:25
qmail/qregexにspamassassin使ってます。
7月終わりからのこの一月半くらいで(51日)、

ブロックしたspamメールは 2238通。

うち、rblでブロックしたもの  664通 (30%)
helo 時点でブロック 162通 ( 7%)
badmailfrom でブロック 1123通 (50%)
SpamAssassinブロック 289通 (13%)

ですた。

一部あんまり煩い .tw/.kr/.cnは丸ごとパケット
捨ててる場合もあり。

30 :名無しさん@お腹いっぱい。:2005/09/13(火) 12:57:50
>>29
> ブロックしたspamメールは 2238通。

ブロックしたのにどうやって spam だと判定するのですか?

31 :名無しさん@お腹いっぱい。:2005/09/13(火) 13:21:15
わかんなければ口をつぐんでろヨ馬鹿

32 :名無しさん@お腹いっぱい。:2005/09/13(火) 14:14:47
>>31
自分がわかってないのを認めるのが嫌だからって、人がわかっていないという
レッテルを張るのはいかがなものか。


33 :名無しさん@お腹いっぱい。:2005/09/13(火) 18:44:49
キチガイに馬鹿というレッテルを貼ったのは俺の間違いだったヨ。謝るよキチガイ。

34 :名無しさん@お腹いっぱい。:2005/09/13(火) 18:51:22
>>33
わたしをキチガイ認定するとは浅はかな人ですね.

35 :名無しさん@お腹いっぱい。:2005/09/13(火) 19:17:12
キチガイキター

36 :名無しさん@お腹いっぱい。:2005/09/13(火) 19:45:41
>>35
浅はかだですね.

37 :29:2005/09/13(火) 20:36:48
みなさん喧嘩しないでくらさい。

38 :名無しさん@お腹いっぱい。:2005/09/18(日) 09:59:27
藻前らSpamAssassin 3.1でつよ。

39 :名無しさん@お腹いっぱい。:2005/09/20(火) 02:55:15
>>28 凸レポート頼むw


40 :名無しさん@お腹いっぱい。:2005/09/22(木) 11:57:56
>>38
アップデート対象
ClamAV 0.86.2 to 0.87 ・・・OK
Razor2 2.67 to 2.72 ・・・OK
SpamAssassin 3.0.1 to 3.1 ・・・NG

プラグインエラーが出た
use_razor2 1
ok_languages ja en

プラグイン有効設定(v310.pre ファイル)
Razor2
TextCat

spamd 再起動 ・・・OK
spamメールテスト ・・・OK

41 :名無しさん@お腹いっぱい。:2005/09/22(木) 12:57:41
SpamAssassin 3.1.0で、spamdではなくspamassassinをprocmailから呼んでます。
RelayCountryを生かしたいのですが、
init.preの
loadplugin Mail::SpamAssassin::Plugin::RelayCountry
を有効にしてもメールに X-Relay-Countries ヘッダがついてくれません。

何かほかに必要なことがあるのでしょうか?
IP::Countryは入っています。


42 :名無しさん@お腹いっぱい。:2005/09/23(金) 18:53:51
>>41
ttp://www.gossamer-threads.com/lists/spamassassin/users/16555?search_string=relaycountry;#16555

43 :名無しさん@お腹いっぱい。:2005/09/23(金) 19:55:26
ありがとうございます。

> I don't believe the RelayCountry plugin adds anything visible to the
> message.

Ok, I didn't get that from the docs (such as they are). I expected the
"X-Relay-Countries" header to be added to the message.

そのURLの通りspamassassin -tD で実験したらちゃんとチェックしてくれていました。

trusted_networks にプロバイダの(secondaryを含む)メールサーバをちゃんと
書かないとあらゆるメールでJPが入ってしまうので書くべきだけど、
名前じゃなくアドレスで書かないとだめだしプロバイダのネットワーク全体を
許可するのも範囲が広すぎるし、というところがちょっと悩みどころですね。
私の使ってるプロバイダはspammerへの対応をちゃんとしてくれる方らしいので
メールサーバなどのアドレスを含むネットワーク全体をtrustしてしまいましたが。


44 :42:2005/09/23(金) 20:08:30
>>43 SAてのは、Emailのメッセージコンテンツで
スパムかどうかを判断する、てのがやっぱ恐らく
本筋の使い方、ということなんじゃないすか。
オリジンやリレーで判断するならRBLsあたりで、

45 :名無しさん@お腹いっぱい。:2005/09/23(金) 22:09:35
ベイジアンフィルタでは結局出現確率しか捉えられないんで、
人間が書いた規則を中心に色んな規則を含めて総合評価できるのがsaじゃないかと。

あとはルールのスコアも自動的に最適値を学習してくれるなら嬉しいんだけど。
マイニングしてルールを自動生成しろとまでは言わないから。


46 :名無しさん@お腹いっぱい。:2005/09/27(火) 15:25:28
>>45 sa-learn --ham
これで学習できるでしょ?
cronで自動化はだめなの?

47 :名無しさん@お腹いっぱい。:2005/09/27(火) 19:34:29
>>46
全然わかってないな


48 :名無しさん@お腹いっぱい。:2005/10/01(土) 11:43:43
各ルールでのスコアを単純に加算するのではなく、それぞれがマッチした
場合の spam 確率を出し、それをまたベイズの定理で組み合わせるとか。

ベイジアンフィルタからの spam 度: 0.8
URIBL: 0.9
SPF SUCCESS: 0.3

となるメールからは

sub mul { $r = 1.0; foreach (@_) { $r *= $_; } $r; }
my @probs = (0.8, 0.9, 0.3);
my $prod = mul(@probs);
$prod / ($prod + mul(map { 1 - $_ } @probs));

=> 0.939...

と計算する。
んで、スコアが閾値以上・以下なら、それぞれのルールにフィードバック。

49 :名無しさん@お腹いっぱい。:2005/10/04(火) 09:24:19
環境
redhat9
sendmail8.12.8-4
milter0.3.0-1.0
spamassassin3.10

質問させてください。
spamassassinでベイジアンフィルタを利用しています。
このベイジアンフィルタなのですが、サーバ単位でspam、hamメールを学習させていますが、
各ユーザ毎にham、spamの基準が違い(mailinglist等)、サーバ単位でなく、
各ユーザ単位でベイジアンフィルタの学習を行わせたいと考えています。
ユーザ毎にベイジアンフィルタのデータベースをbayes_seen、bayes_toksをもって、
自分の趣向に合わせてベイジアンフィルタに学習させるイメージです。

user_prefsがユーザ毎に設定できますが、これはヘッダや本文の条件、
ルールを設定できるだけででした。

ご存知の方がいらっしゃいましたら教えて下さい。
よろしく御願いします。

50 :名無しさん@お腹いっぱい。:2005/10/04(火) 17:22:15
各ユーザが.forwardからspamassassinを呼び出せば済む。
RedHatだとsendmailのMDAがprocmailだったりしそうだから、
.procmailrcに
:0fw: spamassassin.lock
* < 256000
|/usr/bin/spamc
と書くとか。

しっかし、procmailrcはわけわかんね〜。はよmaildropに移行したい…

51 :名無しさん@お腹いっぱい。:2005/10/05(水) 13:36:05
>>50
49です。ありがとうございます。
設定してみます。


52 :名無しさん@お腹いっぱい。:2005/10/26(水) 08:49:34
procmailでspamassassinの設定する方法はあちらこちらにかいてあるけど
qmailでの設定ってほとんど見当たらない。
ユーザごとにいちいち.qmailを編集するのもスマートじゃないし
qmail-scannerあたりを書き直せばいいんだろうけど・・・

と思ってたら、vpopmailでの運用をしてたので、案外簡単にできた。

53 :名無しさん@お腹いっぱい。:2005/10/26(水) 20:11:30
>>52 書き直すまでもなく、使えると思うが。
ttp://qmail-scanner.sourceforge.net/

54 :名無しさん@お腹いっぱい。:2005/10/28(金) 07:41:11
なるほど!情報ありがとう。
先にSpamAssassinいれといてQmail-Scannerをインストールすれば
良いってことですね。

ところで、Qmail−Scannerにバグがあるみたいです。
添付ファイルを処理する際にカッコがあると、途中でエラーをおこし、
メールが返送されてしまうのです。
一応、修正を行ってみたのですが、旨くいくかどうかは未確認なので
確認してから報告したいのですが、なんかML加入しないとダメみたいですね。
チョットメンドクサイ・・・

55 :名無しさん@お腹いっぱい。:2005/10/28(金) 08:02:46
procmailで$HOME/.procmailrcを読みに行かなくすることってできるんでしょうか?
/etc/procmailrcだけで制御したいのですが、ググって調べてると、
「$HOME/.procmailrcが無いときは/etc/procmailrcが読まれる」
ってなことが書かれてて…。

56 :名無しさん@お腹いっぱい。:2005/10/29(土) 07:14:48
>添付ファイルを処理する際にカッコがあると
はて、どゆこと?>>54

57 :名無しさん@お腹いっぱい。:2005/10/29(土) 13:55:36
>>55
ユーザプロセスでは ~/.procmailrc を真っ先に読みに行くってのは
ソースレベルでの仕様だから、それが嫌ならソースを書き換えてビルドするか、
さもなくば全ユーザのホームディレクトリ上で
ln -s /etc/procmailrc ~/.procmailrc するしかないんじゃない?

58 :名無しさん@お腹いっぱい。:2005/10/30(日) 11:42:12
>>56
わかりにくい表現ですいません。
ログにこんなエラーがありました。

Unmatched ( in regex; marked by <-- HERE in m/^ESC$bfc dj8&5f7w2hESC( <-- HERE b.doc$/ at /var/qmail/bin/qmail-scanner-queue.pl line 22 12, <STDIN> line 3221.

ESCの部分は端末上反転していたので、実際は\\と思います。
添付されていたのは日本語の入ったPDFとワード書類です。
で、qmail-scanner-queue.plの該当行のソースがこれ。

push(@uufile_list, $uufile) if(!grep(/^$uufile$/,@uufile_list));

多分$uufileが正しくクオートされておらず、添付ファイル内の「(」が、
正規表現の一部とみなされているようです。
この推測が当たっていれば$uufile --> \Q$uufile\E とすればOKなはずです。(未確認)
で、一応は自己解決をみたわけですが、SpamAssassinのコミュニティに報告するのが
メンドクサイ仕組みなので、なんかどうでもいいやっていう気になってます。

59 :名無しさん@お腹いっぱい。:2005/10/30(日) 12:15:53
>>58 添付ファイル名やその中身に括弧文字が
入っていて起こる鰓てのは初耳す。
qmail-scannerの versionと、そのメールを作った
ソフトは何ですか(Winのoutlookとか thuderbirdとか、
**xのmewとか。。。?)
お話の感じだと、これ、SAの問題ではないと思う。

60 :名無しさん@お腹いっぱい。:2005/10/30(日) 12:59:39
>>59
qmail-scanner-queue.pl 1.25です。
メールを作ったソフトの方は折り返し戻っていってしまったので、
すぐには確認できませんが、送信者からの以前の話からすると
Macのソフトらしいです。たぶんEudora?

それはともかく、該当行の変数名からしてuuencodeされたファイルと思うのですが、
それが正しければSAの問題じゃないでしょうか・・・

61 :59:2005/10/30(日) 14:07:55
>>60
エラーが起きてるのは、qmail-scanner-queue.pl
の、sub check_and_grab_attachments の中ですよね。
uuencode/binhexしたファイル名をいろいろいじったやつ
を添付して試してみてるんだけど、症状再現しないす。
うちも qmail-scanner 1.2.5、んで、SA 3.1。

62 :名無しさん@お腹いっぱい。:2005/10/31(月) 02:56:13
>>61
あ・・・qmail-scannerの問題であってSAの問題じゃないのかな?

症状の再現性については、良くわからないけど
他の添付ファイルでいままで問題が起こったことがないので、
特殊な例かもしれません。
問題を起こす添付ファイルは手元に届いていないし、
届いたとしてもそのまま丸投げするわけに行かないので、
もうちょっと掘り下げてみます。

63 :名無しさん@お腹いっぱい。:2005/11/04(金) 07:10:06
bsfilter と共用してる人いる?
それって意味ある? (片方だけ使うよりも、spam と判断する
確率あがる?)

bsfilter、spamassassin はどちらも、 ベイズ推定に基づいてるので、あまり意味がないように感じてるんだけど、効果があるか気になった。

64 :名無しさん@お腹いっぱい。:2005/11/04(金) 08:59:06
>>63
ほとんど意味無いと思う。
SpamAssassinのベイジアンフィルタだけを使わないで、bsfilterを多段にかける
とかだったらまだわかるが。


65 :名無しさん@お腹いっぱい。:2005/11/04(金) 10:31:57
>>64
SA のベイジアンってそのまま使うと日本語考慮してくれなくね?

66 :64:2005/11/04(金) 10:48:57
>>65
あーなるほど。
bsfilterって最初から日本語化されてたっけ?
bsfilterをnkfとkakasiで日本語化して使うなら、SpamAssassinも
そうやって使うというのはどうだろ。

ちなみに、ベイジアンフィルタ使わなくても、設定でほとんど排除出来るよ。>>63


67 :名無しさん@お腹いっぱい。:2005/11/04(金) 13:28:25
中国語やらのspamもとんでくるしcharsetの指定とかがめちゃくちゃなのも多いので、
日本語だけ対応していても仕方がない。

実際spamassassinだけで日本語も中国語もほぼ全て弾けてるよ(カスタムルール有)。
たまに英語のspamが抜けてくるけど、一日一通以下(受け取るSPAMは100超/日)。
false alarmは登録したサイトの広告的なメールマガジンみたいなものだけ経験がある。
これは受け取り望んでることがわからなければどこからどうみてもSPAMだよなあ、
と思ったので学習は諦めてwhitelistに入れた。


68 :名無しさん@お腹いっぱい。:2005/11/07(月) 17:29:00
sa-learn --hamとか--spamって何を学習させているんですか?
メールの内容を見ているの?ヘッダ部分だけ?


69 :名無しさん@お腹いっぱい。:2005/11/07(月) 17:56:12
>>68
全部

70 :名無しさん@お腹いっぱい。:2005/11/08(火) 12:30:48
>>69 ありがと。
でもその割には、同じ内容のスパムが、何度も来るんだよね。

71 :名無しさん@お腹いっぱい。:2005/11/08(火) 13:03:17
>>70
そりゃBAYES_99になっても、他のスコアが低ければ通っちゃう罠

72 :名無しさん@お腹いっぱい。:2005/11/11(金) 20:55:45
>>63
全く無駄ではないと思う。
ごく稀にSAが取りこぼすspamを捕捉するときがある。
多少の取りこぼしが気にならないなら、入れる必要はないけど。
精度はDNSBLやRazor2とか使えて自動学習してくれる分、SAの方に
分があるように思う。
あと、bsfilterはhamの学習がうまくいかないことがたまにある。

73 :名無しさん@お腹いっぱい。:2005/11/12(土) 08:09:09
false alarmの可能性も同様に増えるから、そのリスクの見積もりと
SAのみの場合にどれだけ不満かの兼ね合いだろうね。


74 :名無しさん@お腹いっぱい。:2005/11/17(木) 12:01:58
>>71 そなのですか?あちゃあ。
BAYES_99は絶対にアウトにする方法ってありますか?
これするとまずい事もあるのですかね。

75 :名無しさん@お腹いっぱい。:2005/11/17(木) 12:56:53
>>74
BAYES_99 のスコアをやたら大きな値にしておけばいいんじゃない?

まずい事っていうか、ベイズを 100% 信じる!という運用ポリシーだと
自分を納得さることが出来るの? (俺には出来ない)

いろんなスコアの積み重ねで spam 判定を行うという仕組みは良く
出来てて、納得して利用しているけどなあ。

76 :名無しさん@お腹いっぱい。:2005/11/29(火) 16:04:35
>>74
推測が必要ない確定的なものはprocmailで捨てれば?

77 :名無しさん@お腹いっぱい。:2005/11/30(水) 14:40:57
>>75-76 サンクス!!
(もともと>>68です)
sa-learn --spamで学習させるという事は絶対にスパム!!wということですよね。
つまり人為的に学習させているわけだけど、BAYES_99のスコアをめちゃ高くしておくと、自動学習でのエラー、つまりハムをスパムと判定してしまったときに、困りますよね。
これはsa-learn --hamで修正するのでしょうけど。あれ?この場合、どっちが勝つんだろ?
仕組みが複雑すぎる..................

78 :名無しさん@お腹いっぱい。:2005/11/30(水) 17:30:48
頭の程度との比較の問題だなw > 仕組みが複雑


79 :名無しさん@お腹いっぱい。:2005/11/30(水) 17:37:11
>>77
ベイジアンフィルターの原理わかってる?
sa-learn --hamでそのメールをhamと学習させても、それ以前の
学習結果によって同じメールがBAYS_99と判別されることだってあるぞ。

あと、スコアリングについてまるで理解できてなさげだな。

80 :名無しさん@お腹いっぱい。:2005/12/02(金) 18:36:49
自動起動のサービスを止めることはできますか?


81 :名無しさん@お腹いっぱい。:2005/12/02(金) 18:38:15
え?

82 :名無しさん@お腹いっぱい。:2005/12/08(木) 13:39:52
>>80 具体的に述べよ。でも、たぶんできるよwww

83 :名無しさん@お腹いっぱい。:2006/01/10(火) 11:52:34
各ユーザーがベイジアン学習させるタイミングっていつ?
レン鯖で使っているんだけど、なかなか学習効果でないんですよ。

84 :名無しさん@お腹いっぱい。:2006/01/10(火) 16:01:57
>>83
設定による


85 :名無しさん@お腹いっぱい。:2006/01/10(火) 20:20:03
razor2 ほかと組み合わせないと、思ったほどの効果はすぐにでない。

86 :名無しさん@お腹いっぱい。:2006/01/17(火) 12:46:17
sa-learn --spamの学習は、各自のspamボックスを
sa-learn --spam --mbox /home/*/mail/spam
でなめさせるから良いと思うけど、
間違ってspamに入ってしまったのを、
訂正学習させるのはおまいらどうやってます?

sa-learn --ham --mbox /home/*/mail/notspam
とか訂正ボックス作れば良いのかな。


87 :名無しさん@お腹いっぱい。:2006/01/17(火) 15:14:23
wanderlust任せ。

88 :名無しさん@お腹いっぱい。:2006/01/18(水) 12:34:30
autolearn=spam が付いてる奴は既に学習済み、再学習する必要なし。
autolearn=no のみ sa-learn すべし。


89 :名無しさん@お腹いっぱい。:2006/01/24(火) 20:53:03
なんか学習させ過ぎるとある時点を境にspam検出率が物凄く落ちるような・・・


90 :名無しさん@お腹いっぱい。:2006/01/26(木) 13:14:55
いつも参考にしていたサイトがディスク障害でデータ消失だって。
ttp://ssss.jp/~trombik/email/spamassassin.html
サルベージしていった方がいいかなぁ。

91 :名無しさん@お腹いっぱい。:2006/02/04(土) 19:03:29
qmail/vpopmail
SpamAssassin3.1.0
qmail-scanner1.25
の環境です。

存在しないメールアドレス宛に着た場合、
~vpopmail/domain/example.jp/user1/auto-whitelist
~vpopmail/domain/example.jp/user1/auto-whitelist.mutex
が自動生成されてしまいます。
その為、ユーザーディレクトリが訳のわからない状況になってしまい、
このファイルの自動生成を停止させることはできますか?

検索してみたら、生成先のパスを変更する解説は多かったんですが、
自動生成停止は見つからなかったので、お願いします。


92 :名無しさん@お腹いっぱい。:2006/02/16(木) 08:34:09
SPAM判定されたものの行き先フォルダをscoreごとに分けてみた。
5-10: 1
10-20: 3
20-: 10
くらいの割合。
サブジェクトを眺めて誤判定がないか確認するのが楽になった。

scoreに応じて色が変わる(段階的または連続的に)というのも面白いと思ったが
wanderlustでそこまでするのは大変そうなので見送り。


93 :名無しさん@お腹いっぱい。:2006/03/11(土) 11:45:40
sendmail+spamassassin+milter で構築しておりやす
外部MTAへ送信するときもX-Flagが付加されているようで
自分自身が送信したメールがX-Spam-Flag:YESって笑えないことも
対策はないでしょうか?

94 :名無しさん@お腹いっぱい。:2006/03/11(土) 11:56:46
特定ドメインはチェックしないという設定が逢ったような気が。

95 :名無しさん@お腹いっぱい。:2006/03/11(土) 12:50:52
milter-spamc を使っていたわけで
spamass-milter の方がよさげかな 試してみます


96 :名無しさん@お腹いっぱい。:2006/03/23(木) 14:03:58
Spamassasin+Postfixで2年ぐらい前に利用してたのですが、
当時、1時間に2-3000通ぐらいしかメールできなくてしぶしぶ外した経験があります。
最近はハードのスペックも上がってきたし、また検討しているのだけど、
みなさんの負荷具合ってどうなんですかね。
実際運用してる方どうですか?どれぐらいのペースでメールの送受信できます?

なんとなく平均これぐらいは飛ぶよ、ってのがわかればいいんですけど。

97 :名無しさん@お腹いっぱい。:2006/03/23(木) 14:57:00
当時使ってたマシンのスペックは?
それが無いと比較できないよ

98 :名無しさん@お腹いっぱい。:2006/03/23(木) 20:31:24
>>96
以前古い処理能力の低い機械をメールゲートウェイにしていた頃は
並列度を上げるより下げた方が実質の処理能力があがったことはある

99 :96:2006/03/23(木) 22:22:27
>>97-98
当時はCeleronの600MHzぐらいのやつで、他のアプリもごりごり動いてたw

まぁ今回はP4-3GHzぐらいのやつで専用のメールゲートウェイにしようかと思うのだが、
メルマガが配信されることがあるサーバなので、できれば懐は広くしておきたいわけよ。
1時間で数万通とかは余裕?平均がどんなもんかしらないのでアレだけど

100 :名無しさん@お腹いっぱい。:2006/03/24(金) 00:20:50
> Celeronの600MHz
って全然2年前じゃないじゃん、5年以上前じゃない?
まあ少なくともパフォーマンスの良いシステムはいくらでも有るわけだから
心配ならそれにしとけば問題ないと思うね
取りあえず2chで使ってるくらいのにしといたら

101 :96:2006/03/24(金) 12:53:03
>>100
当時、そのスペック使ってた会社だったのでw

あと、何通送れるとかは検証するしかないのか。ちと面倒だな。
最後にSpamassasinのパフォーマンスに関して参考になるサイトがあれば教えて下さいです。
パフォーマンスが落ちるとかなんとか書いているサイトはあるけど具体的な数字で検証しているところが見つからない。

102 :名無しさん@お腹いっぱい。:2006/03/24(金) 17:04:43
ま、やってみたら、
結局マシンパワーの問題だから最近の高性能マシンならまず問題起きないよ
逆にそれで問題起こるならスンゴイ大量のユーザ抱えてるっと事だからもっと根本から見直した方が良い
メールGWを複数設置して並列処理するとかね、

ちなみに1時間に2〜3000通って商売はSPAM屋かい?


103 :名無しさん@お腹いっぱい。:2006/03/24(金) 17:48:04
>>102
SPAM屋だったら単位時間あたり送付量にゼロの数が二つくらい足らないと思われ


104 :名無しさん@お腹いっぱい。:2006/03/24(金) 18:20:00
本物のSPAM屋 乙!

105 :名無しさん@お腹いっぱい。:2006/03/26(日) 16:08:02
3.1.1あげ

106 :名無しさん@お腹いっぱい。:2006/04/03(月) 16:05:40
$USER_HOME/.spamassassin/user_prefs:

各ユーザーがWebベースで、このファイルをメンテできるツールありますでしょうか。


107 :名無しさん@お腹いっぱい。:2006/04/04(火) 01:05:04
user_prefsをMySQLで管理しているのであれば、すぐにいくつか見つかると思う。
俺はSquirrelmailのプラグインを使っている。
http://www.squirrelmail.org/plugin_view.php?id=167

108 :名無しさん@お腹いっぱい。:2006/04/04(火) 11:20:19
>>107 ありがとうございました。チャレンジしてみます。
他のツールご利用の方いましたら、よろしければ使用感など教えてください。

109 :名無しさん@お腹いっぱい。:2006/04/04(火) 13:17:58
>>106
List from SA
ttp://wiki.apache.org/spamassassin/WebUserInterfaces

→phpsaadmin
ttp://www.misak.dk/blog/

→WebUserPrefs
ttp://sourceforge.net/projects/webuserprefs/

110 :名無しさん@お腹いっぱい。:2006/04/04(火) 15:59:54
06.3.18 SpamAssassinユーザー会発足
ttp://www.spamassassin.jp/

111 :名無しさん@お腹いっぱい。:2006/04/30(日) 08:10:26
これってサーバーに入ってなくてもユーザーがホームディレクトリにインストールしてつかえるの?

112 :名無しさん@お腹いっぱい。:2006/05/03(水) 11:35:52
>>111
http://svn.apache.org/repos/asf/spamassassin/branches/3.1/INSTALL


113 :名無しさん@お腹いっぱい。:2006/05/15(月) 11:28:45
cronで、定期的に
sa-learn --spam /home/*/Maildir/.Spam/cur
とやっているんですが、最新の3.1.1にしてからメールが存在しない時に
archive-iterator: readdir found no mail in '/home/hogehoge/Maildir/.Spam/cur' directory
というエラーを吐くようになりました。このエラーを出さなくする方法ってないんでしょうか?
面倒だけど、メールが無かったら実行しないようにするスクリプトを組まないといけないのかなぁ。

114 :名無しさん@お腹いっぱい。:2006/05/17(水) 01:22:09
>>113
そりゃエラーじゃない、「読み込むべき対象がない」と報告したに過ぎない。

>メールが無かったら実行しないようにするスクリプト

それが本来の解決方法。
更に言うなら>>88参照。


115 :名無しさん@お腹いっぱい。:2006/06/05(月) 15:25:24
mysqlを設置したのですが、AWLはメールアドレスが順位付けられて
見ていて楽しいです。でも、ユーザー毎に設定されるのが無駄な気が。
デフォーで全ユーザー共通のが便利じゃないかなあ。


116 :のくす牧場:2006/07/09(日) 22:26:05
spamassasinは、スペースで単語を区切っているっぽいので、
日本語の場合はkakasiで分かち書きにして学習させるパッチを作ってみました。
せっかくなので興味のある人は使ってみてください。
http://sea-mew.jp/nox/data/linux/spamassassin.html

117 :名無しさん@お腹いっぱい。:2006/07/09(日) 23:29:01
自分のやってることが車輪の再発明でないかまず確認してもよかったのではないかと。
いや、努力を否定するつもりはないんだけど……。


118 :名無しさん@お腹いっぱい。:2006/07/09(日) 23:43:16
お、使ってみる。

119 :116:2006/07/10(月) 00:01:24
>>117
もちろん、こんなことだれかが考えていると思って探したら、
ITmediaに記事が出ていたんだけども、
そのサイトに行ってみたけど、
どこから落として良いのかわからなかったのですよ。。。

と思ったら、
http://mm.apache.jp/pipermail/spamassassin-jp/2006-February/000041.html
が見つかりました。



120 :116:2006/07/10(月) 00:29:24
http://www.emaillab.org/spamassassin/
ここに新しい物がありました。こちらを使う方が良さそうです。


121 :名無しさん@お腹いっぱい。:2006/07/10(月) 12:02:32
>>116
SpamAssassinほどメジャーなツールで、意外にずっと分かち書き対応パッチ無かったよね。
自分もずっと探してたんだけど、ずっと見つけられなかったもの。
もう一歩遅かった。

122 :名無しさん@お腹いっぱい。:2006/07/10(月) 20:23:50
そんなの必要?
うちだとそんなことしなくても
日本語のSPAMはほぼ完全に蹴ってくれるけど。
パラメータやルールはカスタマイズしてるものの。


123 :名無しさん@お腹いっぱい。:2006/07/10(月) 23:28:01
123

124 :名無しさん@お腹いっぱい。:2006/07/11(火) 00:25:57
>>122
ベイジアンフィルタの性能は低いよ。原理的に考えてもそうだよね。分かち書きしてないんだから。
だからよく誤検出の元になる。蹴らないんじゃなくて蹴りすぎる。

125 :名無しさん@お腹いっぱい。:2006/07/11(火) 11:01:59
うちで蹴りすぎる例はほとんどない。
電気店とかの商売メルマガがたまに蹴られるくらいで、
自分で見てもこれはまあ仕方がない、と思ってしまうようなもの。
2、3回くらいhamとして登録すれば問題なくなるけど、もっとも
こういうのはspamassassinに通すより先に振り分けてしまうからな。


126 :名無しさん@お腹いっぱい。:2006/07/13(木) 00:45:22
>>122
そんなパラメータの調整なんて必要?
うちは、日本語化パッチを当てるだけで、完全に蹴ってくれるよ。
そもそも、学習が自動で、調整が要らないのがベイズフィルタの利点では。

>うちで蹴りすぎる例はほとんどない。
蹴っているメールをチェックしなければいけないのであれば、
蹴る意味がないのでは?
(蹴っているんじゃなくて、振り分けているだけでは?)


もちろん、そんなの人それぞれですけどね。
導入も我慢も諦めも、コストですから。
しかし、このパッチの導入コストは、メリットに十分見合うと思うけどね。




127 :名無しさん@お腹いっぱい。:2006/07/13(木) 13:48:55
>>126
単語の出現確率だけを扱うようなベイスフィルタでは原理的に捉えられない特徴を
ルールに書いてるので。
ベイズフィルタだけを信用するようなスコア設定にもしていないしね。

spamassassinの導入はportsに頼ってるのでパッチはコストが高いです。


128 :名無しさん@お腹いっぱい。:2006/07/13(木) 21:54:23
>>127
> ベイスフィルタでは原理的に捉えられない特徴を
であれば、そのフィルタとベイジアンフィルタの効果は独立事象になるわけだから
ベイジアンフィルタの認識率を上げることは、false positiveを下げるために意味ある
ことになると思うんだけど。
つまり、ベイジアンフィルタの性能を高めることは意味がある、ということね。

ただ、portsだとかaptだとか使ってる場合、パッチだと導入障壁が高いというのは理解できる。


129 :名無しさん@お腹いっぱい。:2006/07/14(金) 17:59:35
portsに日本語化patchをオプションで適用できようにsend-prすりゃええやん。

130 :名無しさん@お腹いっぱい。:2006/07/15(土) 13:56:50
p5-SpamAssassinってちょくちょくアップデートされるんで
パッチがすばやく追随してくれる保証があってかつporterが日本人じゃないと
無理じゃない?
japanese/ 以下にslave portを作るとかかな。
俺は使う気ないからやらないが。


131 :名無しさん@お腹いっぱい。:2006/07/15(土) 15:31:04
>>127
おれ、Fedoraだからわからんけど、Portsって不便なんだな。
update調べてパッチ当ててrebuildする10行のスクリプト、cronで動かしてるよ。



132 :名無しさん@お腹いっぱい。:2006/07/16(日) 00:07:25
コスト云々はそういう話じゃないと思うが。




133 :名無しさん@お腹いっぱい。:2006/07/16(日) 04:42:41
>131
portsだとMakefile.localで1行でローカルなpatchは当てられる

134 :名無しさん@お腹いっぱい。:2006/07/16(日) 04:59:19
>>133
なんだ。それはそれですげぇな。

>>126は、そもそも
> 単語の出現確率だけを扱うようなベイスフィルタでは原理的に捉えられない特徴を
> ルールに書いてる
と言っているので、日本語対応のレベルの話じゃなかったな。すまん。

ともあれ、>>120 のパッチすげー。

135 :名無しさん@お腹いっぱい。:2006/07/16(日) 05:07:42
>>131
知らないのなら口を出さないほうがいいぞ。あまりにも的外れ。

136 :131:2006/07/17(月) 00:48:40
>>135
すまんかった。今は反省している。

137 :名無しさん@お腹いっぱい。:2006/07/17(月) 06:51:49
なんか素直な奴だなww

138 :名無しさん@お腹いっぱい。:2006/08/09(水) 18:43:52
# SpamAssassin 3.1.4に対応した日本語対応パッチ
(案、その5)が発表されました (2006-7-29)
# SpamAssassin 3.1.4がリリースされました (2006-7-27)

from ttp://www.spamassassin.jp/

139 :名無しさん@お腹いっぱい。:2006/09/12(火) 16:40:39
3.1.5 にしたら sa-learn が mbx 形式に対してエラーを吐くので調べてみた。
ArchiveIterator.pm の 1144行目。

--- ArchiveIterator.pm.orig     Tue Sep 12 16:39:47 2006
+++ ArchiveIterator.pm  Tue Sep 12 16:39:58 2006
@@ -1141,7 +1141,7 @@
          }
 
           $self->bump_scan_progress();
-         $info->{"$file.$offset"} = Mail::SpamAssassin::Util::receive_date($header);
+         $info->{$offset} = Mail::SpamAssassin::Util::receive_date($header);
 
          # go onto the next message
          seek(INPUT, $offset + $size, 0);


140 :名無しさん@お腹いっぱい。:2006/09/12(火) 20:39:30
>>139
ここに書いてどうする気なんだよ……

141 :名無しさん@お腹いっぱい。:2006/09/12(火) 20:42:46
確かに…

142 :139:2006/09/13(水) 01:27:34
誰かエロい人が project に言ってくれねーかなぁと・・・


143 :名無しさん@お腹いっぱい。:2006/09/13(水) 02:01:41
>>142
お前さんの手柄なんだから自分でコミットすればいいじゃん

144 :名無しさん@お腹いっぱい。:2006/09/13(水) 09:28:55
ホームページ制作王は、世界の権威として名高いCOMDEXが
21世紀のワールドスタンダードに認定したWebパブリッシングアプリケーションである。

ホームページ制作王に不可能はない。
不可能があるとすれば、そこが人類の英知の限界点である。

21世紀、世界のWebはホームページ制作王を中心に回っていくのである。
にもかかわらず、ここ日本では、心ない風評のため、まだまだ普及に
遅れがみられる。

ホームページ制作王を普及させないかぎり、我が国のWebは、
世界の趨勢の後塵を拝するばかりである。

世界が認めた高性能!ホームページ制作王
http://pc8.2ch.net/test/read.cgi/hp/1106508682/

145 :名無しさん@お腹いっぱい。:2006/10/07(土) 01:02:21
3.1.6出たね。

146 :名無しさん@お腹いっぱい。:2006/10/09(月) 10:15:41
ルールを書く際に日本語文字列を使う場合はJISコードに変換して,
さらに,メタキャラクタをエスケープしなければなりませんが,
皆さんこの辺はどうやっているのでしょうか。

JISコードへの変換は次のようにやればいいと,ググって見つけたのですが,
メタキャラクタのエスケープを実行してくれるような方法はないのでしょうか。

echo 'サンプル' | nkf -j | awk '{gsub(/\x1B[$(]B/,"");print}'

147 :名無しさん@お腹いっぱい。:2006/10/10(火) 03:55:17
つ tlec.linux.or.jp の「おりじなるこんてんつ」

148 :名無しさん@お腹いっぱい。:2006/10/11(水) 23:52:15
>>146
あまりスマートとは言えませんが、
そのあとにsedでもかければいいのではないでしょうか

echo 'サンプル' | nkf -j | awk '{gsub(/\x1B[$(]B/,"");print}' | sed 's/\(\.\|\`\|\*\|\+\|\/\|\?\|\^\|\$\|\#\|\{\|\}\|\(\|\)\|\[\|\]/\\\1/g'


149 :148:2006/10/11(水) 23:57:59
>>146
ごめん、今試したらミスってた。
↓でどうでしょう?

echo 'サンプル' | nkf -j | awk '{gsub(/\x1B[$(]B/,"");print}' | sed 's/\(\.\|`\|\*\|\+\|\/\|\?\|\^\|\$\|\#\|{\|}\|(\|)\|\[\|\]\)/\\\1/g'

# どっちにしろスマートじゃないよなぁ。

150 :146:2006/10/12(木) 09:47:07
>>149

サンクス。これはすばらしい。早速使わせてもらいます。

151 :名無しさん@お腹いっぱい。:2006/10/12(木) 14:04:14
http://sa.intaa.net/ なんてのもある。

152 :148:2006/10/12(木) 16:40:22
sa-updateについて質問です。

http://spamassassin.jp/modules/xhnewbb/viewtopic.php?topic_id=14
↑を見てsa-updateを使える状況にはなっています。
crontabに登録して自動的に更新するようにしたいのですが、
どのくらいの頻度で更新するのがよいのでしょうか?

現在は
0 2 * * 5 /somewhere/spamassassin-update
として金曜日に更新するようにしています。
週1回くらいでちょうどいいものなのでしょうか?
spamassassin-updateはsa-updateとspamdのrestartをしています。

153 :146:2006/10/13(金) 09:06:42
>>151

おお,これはすばらしい。これなら,簡単にルールを作れそうです。
どうもありがとうございます。

154 :名無しさん@お腹いっぱい。:2006/10/18(水) 18:45:16
最近、捕捉率が低下したorz

155 :名無しさん@お腹いっぱい。:2006/10/18(水) 19:29:42
最近は Returned mail 型が大量に増えますた。一括で別フォルダに振り分けるしかないか。

156 :すまん:2006/10/18(水) 20:39:23
http://news18.2ch.net/test/read.cgi/dqnplus/1158464714/l50

スルーしてね。

157 :名無しさん@お腹いっぱい。:2006/10/19(木) 11:41:12
>>155 Gmailとthunderbirdで同系列のメールを受信させているけど、
こちらはやや低下してはいるけど、assassinの捕捉率ががた落ちしちゃった。

例えば、

------------------------------------
Company name: Texhoma Energy, Inc.
Stock symbol: TXHE.PK
Current price: 0.10$ (growth + 10%)
Expected price 10/18/2006: 0.29$
Expected price 10/20/2006: 4.52$
------------------------------------
Please read this mail attentively!!!!!!!!! This is strictly confidential information. Don't send it
to anybody. Only now is a right moment to buy that stock. You can take it now for a low price. On Friday , 20
October the following news will be announced:

以下略

158 :名無しさん@お腹いっぱい。:2006/10/19(木) 21:58:20
>>157
うちもすり抜けてウザーだったから
portupgrade mail/p5-Mail-SpamAssassinしたら
3.1.6で補足出来てますよ〜

159 :名無しさん@お腹いっぱい。:2006/10/29(日) 09:24:22
>>154
どんなのがすり抜けてきてる?


160 :名無しさん@お腹いっぱい。:2006/11/02(木) 05:05:58
spamassassinがqmailscannerと連動してくれない
clamavやperlscannerとは連動しているのに
どうしてなんだろ

161 :名無しさん@お腹いっぱい。:2006/11/14(火) 16:54:34
3.1.5です。>157みたいな英文のスパムの捕捉率がついに50%割っちゃったotz
レンサバなので3.1.6にできない。くやしーw

162 :名無しさん@お腹いっぱい。:2006/11/16(木) 11:32:47
Company: The Motion Picture Group 
Symbol: MPRG 
Price: $0.25 
3 Day Target: $1.00 
Status: Strong Investment

この書式をNG登録する良い方法って無いでしょうか。

Company:
Symbol: 
Price: $ 
3 Day Target: 
Status:




163 :名無しさん@お腹いっぱい。:2006/11/16(木) 22:17:55
>>162
それボットネット野郎のspamですなw
SAのスレなのは承知でひとつ、
どうしてもSAでダメならProcmailのレシピで
SAに飛ばす手前で処理させればよろし。
振り分けがmilterだったら調べてくだされ。

例)
:0 B
* < 3000
* .*Symbol*
* .*Price*
* .*3 Day Target*
* .*Status*
$MAILDIR/trash/.

164 :名無しさん@お腹いっぱい。:2006/11/17(金) 15:20:45
http://www.spamhaus.org/statistics/spammers.lasso

世界トップ10スパマーだって。天誅!

165 :名無しさん@お腹いっぱい。:2006/11/17(金) 19:50:44
>>164
ここまでわかってるのになんでタイーホできないんだろうねぇ
やっぱり国の事情なのかなぁ(´・ω・`)

腹立ってしょうがない

166 :名無しさん@お腹いっぱい。:2006/12/04(月) 10:44:33
>162
ここの日記が参考になります。
株式spamの排除 その3 2006年11月14日
ttp://nikki.hart.co.jp/
ttp://nikki.hart.co.jp/index.php?UID=1163472431


167 :名無しさん@お腹いっぱい。:2006/12/07(木) 12:00:52
安倍内閣メールマガジン ttp://www.kantei.go.jp/jp/m-magazine/

このメールのアドレスを
whitelist_from kantei@mmz.kantei.go.jp
としたんだけどスパム扱いになってしまった。

どうも、Fromの "首相官邸 <kantei@mmz.kantei.go.jp>" ってやつの
首の字がまずいような気がする。
( 首が、JISで 3c37 ってことは < と同じなんだよね。)

全国の首の字で始まる方、ご注意ください。

168 :名無しさん@お腹いっぱい。:2006/12/07(木) 18:11:45
MIMEエンコードされてるのに何言ってんの

169 :名無しさん@お腹いっぱい。:2006/12/08(金) 12:47:51
生JISで送られてきたんじゃね?w

170 :名無しさん@お腹いっぱい。:2006/12/08(金) 18:29:08
だったらそんなフィルタ入れてる上流に文句言うべきだよな。
俺のところにはちゃんとMIMEエンコードで来てたから。

171 :名無しさん@お腹いっぱい。:2006/12/08(金) 18:37:07
生JISは悪くないだろ

172 :名無しさん@お腹いっぱい。:2006/12/08(金) 20:48:18
もしかして、日本語対応パッチっていうのをやっているからなのかなぁ...
MeCabいれて、MeCabの辞書いれて、いくつかのPerlモジュールいれたんだよなぁ...
日本語対応パッチがヘッダのエンコードをデコードしてしまっているためかもしれないなぁ...
よくわからんけど...



173 :名無しさん@お腹いっぱい。:2006/12/08(金) 21:54:18
>>172
それだったらさらに関係ないんじゃない?
日本語パッチでは確か、内部UTF-8処理だったと思うんで。

174 :名無しさん@お腹いっぱい。:2006/12/09(土) 10:40:24
でも、JIS のMIMEエンコードをデコードしてからUTF-8に変換するんじゃないの?

175 :名無しさん@お腹いっぱい。:2006/12/09(土) 11:32:44
MIMEエンコードをデコードしてそれを処理してからUTF-8に変換するのか? 変な奴。

176 :名無しさん@お腹いっぱい。:2006/12/11(月) 12:56:53
>>163
このシリーズで、gifに埋め込まれて送られるバージョンが来た!!


177 :名無しさん@お腹いっぱい。:2006/12/11(月) 19:17:57
RBL関連のスコアはかなり低くしといたほうがよさげ。

SORBSとNJABLでInfoWebの動的IPがblacklist入りして、それだけでスコアが3.9に。
RCVD_NUMERIC_HELOが1.5なので、HELOに適当なホスト名ではなく自分のIPアドレスを
名乗るMTAだったりすると、もうspamと判定されちゃう。

178 :163:2006/12/11(月) 22:39:29
>>176
株式タイプはgifだけじゃなくてpngもjpegもあるよ、
うちにはずいぶん前からきてる
procmailの場合下のキーワードにwindows-1250なんかの文字コードや
他にいくつかのキーワードを混ぜてはじいてる。
おいらはSA使ってないからよくわからんけど
(ってかSA使うスキルないからこのスレ指くわえて見てるだけのヘタレだけど)
SAはデフォルトだと画像系防げないの?

* ^Content-Type: image/gif;

179 :名無しさん@お腹いっぱい。:2006/12/12(火) 09:05:29
>>177
自分のIPを名乗るMTAって、それだけでだいぶダメなんだが。

180 :名無しさん@お腹いっぱい。:2006/12/12(火) 11:37:23
>>179
ヘッダを見ると
Received: from 会社のメールサーバのFQDN
Received: from xxx.xxx.xxx.xxx (foo@sample.com@xxx.xxx.xxx.xxx)
Received: from unknown (HELO ?192.168.1.33?) (foo@sample.com@xxx.xxx.xxx.xxx)
注: xxx.xxx.xxx.xxxはプロバイダのIPアドレス
で、最後にヲレ専用のメールサーバに着いていた。

どうやら、送信側の自宅のMUA -> 会社のメールサーバ -> ヲレ専用のメールサーバ
ってな感じで配送されてきたメールの模様。

んで、user_prefsのinternal networksに会社のメールサーバのネットワークを
書いていたんで、xxx.xxx.xxx.xxxにRBLやRCVD_NUMERIC_HELOが適用されたのかな。

181 :名無しさん@お腹いっぱい。:2006/12/12(火) 12:51:05
>>178 gif全部はじいちゃうの?漢ですね。

182 :名無しさん@お腹いっぱい。:2006/12/12(火) 12:52:01
>>180 なんか順序違うし、情報が足りない?

183 :名無しさん@お腹いっぱい。:2006/12/12(火) 13:20:50
>>180
それスパムじゃないメールなの?
相手はどんな環境からメール出してるんだ??

184 :名無しさん@お腹いっぱい。:2006/12/12(火) 13:30:53
>>183
そ。普通の文章を普通のMUAからNATルータ越しに送ってきたもの。なので、最初のHELOは
ローカルIPが生で入っている模様。

会社のサーバでqmail-scannerでウイルスチェックかけて、ヲレのサーバでもclamdで
ウイルスチェックかけているんで、実際のreceived:はもうちょっと煩雑なものになるんだけど。

185 :名無しさん@お腹いっぱい。:2006/12/12(火) 15:00:08
>>184
つまりMTA->MTAじゃなくMUA->MTAってことなんだろ?
ということは自分とこのユーザってことだから、それは当然だわな。

その場合も、MTAからのものと同じようにSpamAssassinのチェックが掛かるということが
177が言ってる問題の本質とみた。

186 :名無しさん@お腹いっぱい。:2006/12/12(火) 16:34:04
あ、clamdじゃなくてclamsmtpで、ですな。ウイルスチェック自体はclamdがやっているけど。

>>185
そそ。動的IPアドレスブロックつかって自前のMTAをあげている場合なら
まだしも、MUAからのメールではまることがあったので驚いたのですだ。

あと、別のサーバから転送されてくるspamの判別を効かせるためにinternal networks
を設定するとはまることがあるんだなぁというお話。

187 :名無しさん@お腹いっぱい。:2006/12/12(火) 17:32:36
>>177 自分のIPアドレスを 名乗る「MTA」だったりすると、もうspamと判定されちゃう。
これで>>180「MUA」を例示するからややこしい。

そもそも、RBL系を利用しているのだから、判定されやすいのは当然なのに。
それに、MUAが吐き出すHELOはほぼ不正なんだけど。



188 :名無しさん@お腹いっぱい。:2006/12/12(火) 17:37:41
まあ、spamassassinのデフォルト設定のスコアリングの危険性が知られるのはいいことだと思う。

189 :名無しさん@お腹いっぱい。:2006/12/12(火) 18:31:18
俺の環境では、LANのIPアドレスがRCVD_NUMERIC_HELOでスコアされる事はないぞ。

MTA上でspamdとして動いています。
user_prefsはtlec謹呈。
3.1.5 & 3.1.7

190 :名無しさん@お腹いっぱい。:2006/12/12(火) 18:54:30
その辺、internal_networksやtrusted_networksの書き方次第じゃないの?

191 :名無しさん@お腹いっぱい。:2006/12/12(火) 18:58:12
>>190 tlecのuser_prefsがイイってこと?


192 :名無しさん@お腹いっぱい。:2006/12/12(火) 23:52:07
>>181
>他にいくつかのキーワードを混ぜてはじいてる。


193 :名無しさん@お腹いっぱい。:2006/12/13(水) 11:06:16
>>190
tlecのuser_prefsには、internal_networksの記述は無い。
trusted_networksはコメントアウトされている。

194 :名無しさん@お腹いっぱい。:2006/12/13(水) 21:44:32
>>193
trusted_networks は利用者が個別に書くことを推奨している。
それが private_prefs と作者が勝手に名付けている奴。


195 :名無しさん@お腹いっぱい。:2006/12/14(木) 10:23:09
これは、private_prefsファィルを設置しないと、働かないんでしょ?


196 :名無しさん@お腹いっぱい。:2006/12/16(土) 17:48:10
>>195
user_prefs のうち、ユーザ個別の設定項目を
別ファイルにした、というのが private_prefs 。
private_prefs には trusted_networks と
MYMTA という設定項目がある。
これらを設定すると有効になるルールが幾つかある。

http://spamassassin.jp/modules/xhnewbb/viewtopic.php?viewmode=thread&topic_id=9&forum=7&post_id=52
http://spamassassin.jp/modules/xhnewbb/viewtopic.php?viewmode=thread&topic_id=9&forum=7&post_id=47

197 :名無しさん@お腹いっぱい。:2007/01/07(日) 20:58:36
spamass-milterでsubjectだけ加工するってのは無いのかょ

198 :名無しさん@お腹いっぱい。:2007/01/07(日) 22:54:43
ここって、amavisdの話もおk?

199 :名無しさん@お腹いっぱい。:2007/01/09(火) 09:28:12
ok

200 :名無しさん@お腹いっぱい。:2007/01/09(火) 11:17:34
spamassassinにスパム学習させる為だけに怪しい出会い系に
入会した私は変態でしょうか?

201 :名無しさん@お腹いっぱい。:2007/01/09(火) 12:11:32
なあに、かえって検出力がつく。


202 :200:2007/01/09(火) 13:33:17
出会い系の登録してそこからのメールを自動的にスパム学習させると
スパムのトレンドに自動的に追随してくれるかなと思って
出来心でやってしまいました。

でも、今一番難しいのは株を買え!系なんですが。

203 :名無しさん@お腹いっぱい。:2007/01/09(火) 14:38:18
>>202
折角なんで有効活用したら?w

株系の画像添付はなかなか難しいよなぁ・・・

204 :名無しさん@お腹いっぱい。:2007/01/09(火) 21:58:40
うちではほとんどカットしてくれてるけどなあ >画像添付

何かコピペか自動生成かって感じの文章が書いてあるだけのが時々抜けてくる。

205 :名無しさん@お腹いっぱい。:2007/01/10(水) 00:08:51
>> 202
FuzzyOCR

206 :名無しさん@お腹いっぱい。:2007/01/10(水) 19:03:36
SPAM朝日
http://society4.2ch.net/test/read.cgi/mass/1165557870/l50

207 :名無しさん@お腹いっぱい。:2007/01/19(金) 10:41:00
http://pc10.2ch.net/test/read.cgi/tech/1163409543/81

208 :名無しさん@お腹いっぱい。:2007/02/15(木) 16:55:20
SpamAssassinを使っているのですが
OBSCURED_EMAIL BODY: Message seems to contain rot13ed address

でSPAM扱いされるメールがあるのですよ。
ROT13(アルファベットを十三文字ずらすあれ)でエンコードされたアドレスがある
というのは判るんだが
何を基準にrot13edかそうでないかを判断してるのかが判らんとです。

教えてエロイ人。

209 :名無しさん@お腹いっぱい。:2007/02/15(木) 17:13:04
>>208
^ と ( を見てるくさい。
@ と . がこれに変換されるのかな。

210 :208:2007/02/15(木) 18:07:57
ってことは
/usr/share/spamassassin/20_body_tests.cf

body EMAIL_ROT13 /\b[a-z(\]-]+\^[a-z-]+\([a-z]{2,3}\b/
ですか。

a-z,(,],- の繰り返しで始まり、

a-z,- の繰り返し、
(
a-z (2 or 3) で終わるってことニカ?
なんか違うような・・・正規表現ですよねこれ

211 :名無しさん@お腹いっぱい。:2007/02/15(木) 22:38:48
最近、株式SPAMのキーワードがコロコロ変わって大変です。

こんなのや
S.umbol: UTEV
Current price: $0.012
Recommendation: very aggresive buy!!!

こんなの
Search for: UTEV
Current price: $0.012
Market: bullish.


212 :名無しさん@お腹いっぱい。:2007/02/15(木) 23:11:36
全部の文字間にHTMLタグとか
テーブルのセル1個に1文字とか
そんなん?

213 :名無しさん@お腹いっぱい。:2007/02/16(金) 00:26:47
いえ、textっす(´・ω・`)
今、また13発着弾してしまいました。

214 :名無しさん@お腹いっぱい。:2007/02/21(水) 11:36:42
/etc/mail/spamassassin/local.cfを、
ttp://tlec.linux.or.jp/docs/の
user_prefsと入れ換えてもOKですか?

ユーザーは50人位です。

215 :名無しさん@お腹いっぱい。:2007/02/22(木) 08:03:30
>>214
個人向け、つまりfalse_positiveも自己責任で処理することを
前提に作られているから、正直お勧めしない。
多少取りこぼしてもよいのなら、 required_score 30 以上に
すれば、少しは安全になるかも。


61 KB
■ このスレッドは過去ログ倉庫に格納されています

★スマホ版★ 掲示板に戻る 全部 前100 次100 最新50

read.cgi ver 05.02.02 2014/06/23 Mango Mangüé ★
FOX ★ DSO(Dynamic Shared Object)