っしゃあ、Qiitaで学びのアウトプットすっぞ!!!
??????
???????????????
お品書き
スパム判定を頂いた経緯
最近勉強のアウトプットをしようとQiitaに投稿を始めました。
このブログでやるべきなのですけど、人様に見せようってなった時に記事数も多いわけで・・・不快に思う記事も中にはあるはず。
ってなわけでこのブログに書くのはやめました。
んでじゃあ別でブログ建てようにもSEO的に他の人の目に間違いなく止まらないから間違っていても放置されるわけで・・・だったらQiitaに投稿しようと思った次第です。
Qiitaだったら新着記事みたいなので表示されるし、見る方もエンジニアが多く間違いを指摘してくださる可能性もあります。
ってなわけでQiitaに記事をぽつぽつ投稿し始めました。
>つゆきさま
いつもQiitaをご利用いただき誠にありがとうございます。
つゆきさまの行動記録から、一時的に記事・コメントの投稿を禁止させていただきました。
身に覚えのない場合は、お手数ですがQiitaサポートよりご連絡ください。
なお、ご連絡をいただけない場合はアカウントの凍結をさせていただくことがございますので、ご了承ください。
ど う し て こ う な っ た 。
投稿した記事は数学の理論について書いたものです。
オリジナリティもあまりないですからコピペ判定したスパム(なるべくわかりやすいよう書き直したつもりではいました。)と判定されてもしょうがないのか・・・・。
スパム判定を頂くとこうなる
んでスパムとなるとどうなるのか。
スパムとなった記事が限定公開になる
同時にメールをいただきました。
つゆきさま
Qiitaへご投稿いただき誠にありがとうございます。
ご投稿いただいた"(記事タイトル)"でございますが、
スパムの疑いがある投稿と判断し、限定公開とさせていただきました。
※限定公開とは、投稿者本人及びURLを知っているユーザーのみ
アクセスすることができる状態です。
スパムではない際はお手数ですが、Qiitaサポートよりご連絡ください。
Qiitaは「プログラマの誰もが楽しくプログラムを書いて、
いろんなモノを生み出すことができる世界」
を実現するために、プログラマ一人一人の知識を共有するサービスです。
スパムの疑いをかけられ、該当記事が限定公開になります。
編集しようとすると
記事編集できない
この表示。
しょうがない、気を改めて新しく記事を書こうとすると
記事投稿できない
また君か。
しょうがないからトップページに表示されている記事でも読むか。
左下に「行動が禁止されています」と表示される
かわいい(白目)
スパム判定を解除してもらうまで
アカウント消されたくないので急いで問い合わせからフォームから連絡。
>お世話になります、先ほどQiita様からメールをいただき、アカウントについてスパム投稿の疑い、また投稿の一時中止をいただきました。
似たような記事が多くあり、スパムと認定されてもしょうがないのですが、スパムではないので解除していただけると幸いです。
また今後スパムでないと判定されないにはどうしたらよいでしょうか。
土曜日だったので連絡は来ず、スマブラをして待っていました。
月曜日、連絡が来ました。
>ご迷惑をおかけしてしまい申し訳ございません。
機械学習により、スパムと誤判定されてしまったようです。
下記記事のスパム判定と行動禁止状態を取り下げさせていただきました。
弊社側で記事を公開させていただきましたが、限定共有化したい場合は申し付けください。
このお問い合わせをもとにスパム判定を改善してまいります。
なお、誤判定されたことにより「いいね」が消えてしまった場合は、弊社で復旧いたしますので、
お手数ですが、その旨をご連絡いただければと思います。
何卒よろしくお願いいたします。
(一部抜粋)
ご丁寧にありがとうございました。そのまま投稿できるようになったので一件落着。
次はスパム判定されないように気を付けるぞ~。
もちろんこのブログも書いていきますのでご安心ください。
おまけ:混合行列と偽陽性
せっかくなのでなぜスパム判定されたのか理解の一助に混合行列のお話をします。
混合行列ってのは地震速報だったり、今回のスパム判定だったり、判定機の性能をみる行列です。
混合行列は上図のように書けます。
中でも
真陽性(実際のスパムをスパムとして判定した数)と
偽陰性(スパムをスパムじゃないと判定した数)と
偽陽性(スパムじゃないものをスパムと判定した数、今回の僕はここ)の3つに注目してほしいのですが、ここの設計が非常に難しいです。
詳しい説明は省きますが、再現率(スパムの取りこぼしがないか)と適合率(余計にスパムと検出していないか)はトレードオフ、つまり片方をよくするともう片方は悪くなります。
例えばスパムの取りこぼしを減らそうと設計したところ、過剰にスパムを検出します。今回はこれ。
反対に過剰にスパムを検出しないようにすると今度はスパムの取りこぼしが多くなってしまいます。
この設計が難しく、設計者は頭を悩ませています。
こんな知識があったので今回の件はイラつかず「混合行列じゃん」と思いながら問い合わせメールを書いていました。
ちょっとした知識でした。
ではまた。