プログラミング

Youtubeから日本語のコメントを非表示するchrome拡張機能を作った

やってること(理屈):
スクロールするごとにコメントを非表示するスクリプトを呼び出してコメント要素を削除する:Youtubeってさすがgoogleで、とにかくソースコードが読めないし、普通動くやつは動かないし、で色々大変。苦戦した結果、一番良さそうなのがスクロールごとに呼び出すって方法でした。スクロールするごとに処理してるので、割とCPU食います。でもそれはコメント読んでて一時的なものなので、まぁ許容していただけるかなと。core i3もあれば固まるってことはないかと思います。

機能:
Youtubeの動画のコメントのうち日本語(かな文字/カタカナ)を含むコメントを非表示します。

なんでこんなもの作ったかというと…
当然、日本語コメントが邪魔だからですね。

Youtube日本語コメント、幼稚なのがすごい多くて、見てて…何も生みませんね。

あとたまに僕のコメントに見るに堪えないリプライがついてたりしてて、もうYoutubeの自分へのコメントは見ないって決めました。

話変わりますが、Youtubeのコメントで自分語りしてる人とか、Youtubeのコメント欄でいつまでも返信繰り返してる人って暇なんでしょうかね。気が楽そうで羨ましいです。

とりあえず要約すると、日本語のコメントは民度が低いので見たくない、ってことですね。なので作りました。
我ながら結構有用。

逆に、日本語以外のすべての言語のコメントを非表示する、なんてこともできます。
日本語以外のコメントなんて興味ねんだよ。外国語?読めねーわ!日本最高だぜ!って方もおられるかもしれません。
もし、もし希望があれば拡張機能出しますが。

ちょっと捻って、これが英語だけ表示する(非表示する)ってなると、難しいんですけどね。

英語は他のアルファベットだけの言語と区別つかないですから。
どうしても区別しようと思ったら、広大なEnglish wordsを文章に一つ一つ検証していってどれくらい英語に近いか、を計算して…ってやるしかないと思いますし。そんなことJavaScriptにしろAPIにしろやったら、ミリ秒じゃ終わりませんよ。
(今思ったけど語根とか語尾とかに分解して英語度を図るってこともできそうですね。案外処理時間かからないかも。)

なので、日本語とか韓国語、ハングル、中国語、ロシア語、ヒンディーといった類は識別しやすいです。スペイン語とか英語とかindo-europeanの方は分かりづらい。
ディープラーニング進めばここらへんもわかってくるのかもしれませんが。
少なくともJavaScriptだけじゃ厳しい領域ですかね。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です