Twoucan’s infomation

Twitterのイラスト・マンガ人気作品とトレンドをチェックできるサービス【Twoucan】の公式ブログです。2018年10月4日、βリリースしました。更新情報などを書いていきます。

βリリースから4週間/Twoucanの仕組み

■ βリリースを終えて

10/4のβリリースから4週間が経過しました。

プレスリリースも配信会社を通して配信したのですが、メディアに取り上げてもらえなかったのが、ちょっと想定外ではありました。
配信が15時という少し遅い時間だったのがいけなかったのかも知れません。もしくは、ニュースバリューがなかったかのどちらかですね…。

そんなこともあり、スタートダッシュはできなかったのですが、
少しずつながらも、アクセスが伸びてきています。こういうサービスに多少なりとも需要があったことに、まずはほっとしています。

リリース段階でのもうひとつの心配事は、8月末に起きた「イラストまとめサービス無断転載(冤罪)騒動」です。

nlab.itmedia.co.jp

もちろんこの無断転載というのは冤罪で、Twitter APIのルールに準拠した使用であれば、問題はない(=無断転載にはあたらない)のですが、ここまで騒動が大きくなったことに正直、ちょっと驚きました。

弊社ではずっと「TINAMI」というサイトを運営しています。同じようにイラスト・マンガに関するサービスなので、ある程度、この界隈のユーザーさんのメンタリティについては、一定の理解をしているつもりです。
特に「ルール上・モラル上問題がなくても、掲載されることを望まない層」が一定数存在します。「同好の士は増やしたいが、そうでない人には極力見られたくない」という、一見すると相反する状況が共存する世界でもあります。

このセンシティブな状況を長年の運営経験から多少なりとも理解しているつもりではあったので、前述の騒動とは関係なく、掲載拒否ができる仕組みは用意する予定でした。

とはいえ「無断転載している!」という一方的な決めつけと、その(間違った)情報の拡散の速度と影響力が正直ここまで大きいとは予想していなかったのです。そのため、TwitterにおけるAPI利用ルールについて理解が深くない人に対しても、丁寧に説明するドキュメントを用意しました。

そのかいあってか、それとも単に知名度の問題か…いまのところ大きな問題は起きていません。この先はまだわかりませんが、何かあっても都度きちんとした説明ができるような体制を維持していきたいと思います。

■ Twoucanの仕組みについて

公式Twitterにも書きましたが、10/31の表示対象ツイートが10,000件を突破しました。有効な表示対象ツイートの総数は、約103万件です。

Twitterの情報から、特定の画像を含むツイートのみを抽出する方法で最もシンプルなのは、Public Streamsで画像のあるツイートのみを抽出し、それを片っ端から(機械学習などの手段で)判別・分類する方法でしょうか。

とはいえその方法だと、判別すべき画像の量が膨大な数になりますし、それらをダウンロードする太い回線と、解析するだけのマシンパワーを必要とします。ここでは割愛しますが、他にもハードルの高い要素が揃っているので、TwoucanではPublic Streamsを利用していません。

そのかわり、着目したのがソーシャルグラフ(アカウント同士のつながり)です。例えば絵描きさんは絵描きさんをフォローしているだろうし、フォローされている。フロワーの多いインフルエンサーの絵描きさんのアカウントをスタートに、その人達の「つながり」を解析すると、Twitter上での「絵描きの母集団」がぼんやりと見えてきます。

この母集団のなかで流通するツイートを取得してくることで、イラストを多く含んだツイートが抽出できます。当然のことながら、絵を描く人は絵を見るのも好きで、いい作品はどんどんリツイートしたり、いいね!を押してくれる…というわけです。この母集団の解析は、サービスの運用を行いながら、少しずつ拡げています。よって、Twoucanでは時間の経過とともに取得できるツイートも増加していくのです。

画像はサイズ判別や文章、ハッシュタグなどでも作品内容を推測していますが、実はTwoucanでは現状、機械学習は一切使用していません「よくある質問」の部分では機械学習を少し使ってます的なことを書いてしまったのですが…白状します。一切使っていないのです。

とはいえ、機械学習を使っていない現状でも、恐らく作品種別の誤認識率は3〜5%くらいに収まっていると思います(手前味噌で恐縮なんですが、これってけっこうすごくないですか?)

開発時の想定では、そこそこうまくいく…とは思っていましたが、表示対象ツイート数が1万件/日を超える状況でも、この数字が維持できるとは到底考えていなかったので、うれしい誤算です。

ともあれ、機械学習は今後、導入していきたいと思います。約半年かけて得られたNGなデータを学習させて、表示対象ツイートのなかからTwoucanの趣旨に合わない画像を選び出して除外していく…というのができればと思います。

  • 猫と犬の写真
  • ソシャゲのスクショ
  • 韓国アイドルの写真

目下、Twoucanが対策しなければならないのは下記の画像です(笑)。

実写の写真は顔認識でやれそう。すでにTINAMIのほうでOpenCVの顔認識を導入している(コスプレ画像の判別に利用しています)ので、そっちを流用するつもりです。ソシャゲのスクショは画像ハッシュ(phash)あたりが活用できそう。猫や犬の画像こそ、機械学習の出番でしょうか。下記の記事あたりが参考になりそうです。

ねこと画像処理 part 1 – 素材集め « Rest Term

ねこと画像処理 part 2 – 猫検出 (モデル配布) « Rest Term

ねこと画像処理 part 3 – Deep Learningで猫の品種識別 « Rest Term

サービスとしてまだまだ課題も多いですが、ひとつひとつクリアしていこうと思います。暖かく見守って頂けましたら幸いです!

 

また、サービスをご覧になってない方は下記よりぜひ使ってみてください。
叱咤激励もお待ちしております!

twoucan.com

※ちなみにこれを書いている自分はエンジニアではありませんので、何か技術的な表現に間違いがあっても笑ってスルーしてやってください。

 

β版リリース

本日よりβ版がスタートしました。

なお、表示対象データについては、約半年分(2018年4月頃〜現在)となっています。ただし、Twitter上のすべてのデータを取得しているわけではないことをご了承ください。

また、人気のツイートに関してはリツイートで流れてくることも多いので、その場合は2018年4月以前のものも入っています。

「Twoucan」はTwitter API を利用しています。表示されているツイートはTwitter利用規約を遵守しており、無断転載ではありませんのでご安心ください!

 

■ Twoucan - Twitterのイラスト・マンガ人気作品とトレンドをチェック!

https://twoucan.com/

 

リリースにあたり、プレスリリースも公開しています。

www.value-press.com

 

はじめに

はじめまして、本日2018年10月4日よりβリリースをしたサービス【Twoucan】のブログです。サービスの更新情報はこちらの「はてなブログ」で書いていきますのでよろしくお願い致します。

また更新情報に限らず、今後の更新予定や目標なども、随時書いていきます。

まずはぜひ、サービスを使ってみてください!

 

■ Twoucan - Twitterのイラスト・マンガ人気作品とトレンドをチェック!

https://twoucan.com/