Skip to content

spamfilter.rb

TADA Tadashi edited this page Nov 10, 2017 · 3 revisions

基本

spamと判定されたコメントの処理方法。

ツッコミ(コメント)そのものを無かったことにして破棄するか、保存はするが非表示とするかを選択します。

ツッコミ中に以下の値より多くのURIが含まれるものはspamとみなす。

この機能が出た当初はspamにはURIが大量に含まれているのが当たり前だったので、3くらいに設定しておけばspamを弾けましたが、近頃はURIを一つしか含まないor全く含まないものが出現しているので効果が薄れてきました。それでも設定しておくと従来のURI大量列挙型のspamは弾けますから設定しておくに越したことはありません。

ツッコミの中でURIを表す文字数(バイト数)の占める割合が以下の値よりもよりも高いものはspamとみなす。

URIの場合、英数字から構成されるので1文字1バイトとなります。例えば

http://www.example.com

の場合は22バイトとなります。

以下に列挙されたパターンを使って構成されるパターンにマッチするURIを含むツッコミはspamとみなす。実際に使用されるパターンについてはupdate_configメソッドを参照。

spamと見なすURIに含まれる文字列を指定します。文字列を指定するときはhttp等のスキームの指定は必要ありません。例えばhttp://www.example.comというURIを含むツッコミをspamと判定する場合は example や example.com 等と指定します。

ツッコミ本文が以下に列挙されたパターンにマッチする場合はspamとみなす。

この項目にはhref=等を指定するとよいでしょう。tDiaryのツッコミではURIは自動でアンカータグに展開されるため、わざわざHTMLであるhref=を指定しているものはspamの場合が多いです。

ツッコミのメールアドレスが以下に列挙されたパターンにマッチする場合はspamとみなす。

spamと見なすメールアドレスに含まれる文字列を指定します。URIの場合と違って自動で展開されません。例えば[email protected]というメールアドレスを指定したツッコミをspamと判定する場合は example example.com [email protected] のいずれかを指定します。

ツッコミのメールアドレスのチェックにURI用のパターンを使用する。

URIに指定しているパターン(文字列)をメールアドレスのチェックにそのまま使う場合にオンにします。

日付け

以下の日付けへのコメントはspamとみなす。

ここに入力した日数よりも過去の日記に対するツッコミをspamと見なします。

この項目に数値を入力した場合、過去の日記に対するツッコミが全てspamと見なされてしまうので、過去の日記に一般の読者からのツッコミがあるようなコンテンツがある場合は注意する必要があります。

IPアドレス

ツッコミやTrackBackの送信元のIPアドレスが以下のリストにマッチする場合はspamとみなす(リストには完全なIPアドレスまたは「.」で終わるIPアドレスの一部を記述する)。

TrackBack送信元のIPアドレスと実際のサイトのIPアドレスがマッチしない場合はspamとみなす。

IPアドレス条件によってspamとみなされたトラックバックの処理方法。

Domain Blacklist Services

Domain Blacklist ServicesとはDNSBL(DNS Black List)と呼ばれるspamと見なされているホストのリストを利用したspam判定のサービスです。

tDiaryのspamフィルタでは「ツッコミ中に含まれているURI全てのホスト名」についてDNSBLに登録されているかどうかを問い合わせます。登録されていた場合はspamと判定されます。

Domain Blacklist に利用するサーバーを指定します。複数のサーバーを指定する場合は改行で区切る必要があります。

DNSBLの数をあまり増やしすぎると、ツッコミをした時の処理が遅くなる場合があるので注意する必要があります。

DNSBLに問い合わせを行わないホストを指定します。検索エンジン等を指定してください。

Clone this wiki locally