あなたの購買履歴、交友関係、通話・メッセージ内容、行動範囲。
スマートフォンを利用して、特定の検索エンジンを開き、SNSで日々の活動を投稿。今では当たり前のあなたの行動は上記のデータを提供することと同義なのです。
そしてそれらを実際に行っているのが、GAFAと呼ばれるGoogle, Amazon、Facebook、AppleのITの巨人たちです。今やGoogleで行われる検索回数は1日30億回にまで達し、日々膨大なデータが特定の企業に集中しているのです。
あなたのデータ(閲覧履歴、SNS投稿、通話、チャット履歴)には価値があります。今は無料でSNS等のサービスを使う代わりにそれらを提供しているわけですが、これを理解して利用する人は意外と少ないのかもしれません。
そんな現状の中、人々の音声に着目し、ブロックチェーンを用いて個人の特定を防ぎながら、音声データを提供してくれたユーザにはしっかりと報酬を与えて還元する、オープンソースのプラットフォームを提供するLangnetの可能性について見ていきたいと思います。
GAFAの支配
Ok Google!、Alexa!、Hey Siri!
あなたがスマートフォンやLINEのClovaに喋りかけた内容って一体どこに保存されているのか、気になったことはありませんか。
Google、Amazon、Appleらはあなたが持つその身近なデバイスで、あなたの音声データを集積・解析しています。日々世界中で集積されるその膨大なデータ量は、彼らのマーケティングや新規事業の分析等に利用されるのです。
それの何が問題なのか?
例えば、あなたの動画もしくは写真はFacebookやLINE、その他のSNSで簡単に拾ってこれます。あなたの音声データも充分に蓄えられているとしましょう。
それさえあれば、GAFAはオンライン上で充分あなたに扮して、何かを発言することが可能となるのです。
こんな恐ろしいことができてしまうなんて、想像していたでしょうか。SNSを使うということは、自分のデータを提供することに等しいということをご留意下さい。
しかし、実際に音声アシスタントサービスは非常に便利。より便利な社会の実現のためにも、これを諦めるわけにはいきませんよね。
そこで、今回ご紹介したいのが、あなた個人を特定することなく、またどこかの機関や企業が集積されたデータを管理することのない「Langnet」というサービス。
ラングネットの概要
ラングネット(LangNet)は、言語認識サービス、音声アシスタント、チャットボット、言語ベースの分析をサポートする、言語技術全般のための分散型でオープンソースのエコシステムです。ユーザーは自分の音声データを提供することでトークンを貰うことができ、これによって集積されたデータはオープンソースとなっており、アプリ開発者等はAPIで接続してそのデータにアクセスすることが可能です。
言葉にすると難しいので、下図に実際にテレグラムのBot機能を利用した様子を添付しました。
普段文字を打ち込むダッシュボードにある”Get Sentences”を押すと、太字で文章が提示されます。
下図の場合は”How can I get Robson street from Manchester?”
実際に録音して送ると、私の録音した文章が買い上げられたと記載されています!
(The sentences ….. Was validated. You have earned 1.018LANG tokens)
そしてまた次の文章が提示されていき、それを繰り返すといった形です。
ラングネットが言うには大体1時間分の音声データを提供すると約1000円分の報酬を受け取れるとのことで、インセンティブとしては充分かと思われます。
また、集積されたデータはユーザー個人を特定できず(テレグラムで登録する際に必要なのは電話番号のみで、本名を利用しなくても大丈夫です。)そして、その情報はオープンソース、つまり誰か特定の機関や企業が独占するのではなく、基本的に誰でもアプリ開発等でデータを利用することが出来るのです。
ラングネットのウェブサイトはこちらでご覧いただけます。https://langnet.io/
ラングネットのメンバーの概要
CEOのRob Lyu Linkedin
ラングネットのCEO、Rob Lyuさんはアメリカのペンシルバニア大学を卒業後、プライベートバンキングやVCを渡り歩いて2017年にこのラングネットを設立しました。経歴からも推測できるようにきれいなアクセントの英語を話す、ビジネスに長けた正にCEO向きの方です。テレグラムでは、率先して質問に対応してくださる気さくさもありますので、もし何か質問があればテレグラムチャンネルでお気軽に質問してみて下さい。
Tech LeadのLucas Jo Linkedin
ラングネットの技術部門のトップLucas Joさんはスピーチ/ オーディオアルゴリズムやシステム開発という領域で10年以上もの経験を有するプロフェッショナルです。ソウル大学の音声認識分野で学士号と修士号を修了。
Director/ Development & StrategyのHadar Abramovich Linkedin
ラングネットのテレグラムコミュニティで真っ先に出迎えてくれるのがHadar。10年以上ものマーケティング部門での経験と、その内の4年程をアジア地域で過ごし、多彩なネットワークを持ちます。ラングネットの戦略立案からビジネスデベロップメントを受け持つ、UCLAアンダーソン校卒、韓国大学のMBAを修了。
早速ラングネットに直接聞いてみた
既に16,000人近い登録者がいるテレグラムチャンネルですが、CEOのRobさんや、が気さくに質問に答えてくれる様子だったので実際に疑問点をぶつけてみたところ、真摯に対応していただきましたので、そのやり取りを抜粋してお届けします!
- Block Rabbit編集部:
ラングネットは非常に興味深いサービスですね!一般的な企業は、ユーザーが提供するデータに対して何も報酬を与えないのが一般的ですが、提供した分に応じて報酬を与える試みは、新しい概念を提供するものだと考えています。ところで、膨大なデータ量を集積するわけですが、ラングネットは独自のサービスを開発する予定はないのでしょうか?
- Hadar:
まず興味をもっていただき、ありがとうございます!勿論ラングネットとしても、ヘルスケア、ゲーム、セキュリティ、音声バイオマトリクス等、様々な分野のパートナーと協業を進めて収益の基盤を作れればと考えています。
- Block Rabbit編集部:
それは今後の動きも楽しみですね。ちなみにラングネットのどの部分においてブロックチェーンが適しているとお考えですか?
- Rob:
ブロックチェーンは分散的な手法で、ユーザーのデータが何に使われたのか、そしてそのデータの権限、引用されたAPIサービスの追跡に用いられます。
- Block Rabbit編集部:
なるほど。Etherscanみたいにトランザクションを可視化するのはイメージできました。でもそれだと実際にデータがどのように使われたのかってよく分からないと思うのですが如何でしょうか?
- Rob:
自分のデータを提供するか否かは、その都度リクエストが来るように設定します。もしくは第三者に自分のデータの扱いを委任することもできます。もし、あなたのデータがAIシステムの作成に用いられた場合は、そのシステムの権限を、そのシステムが発行するトークンという形で受け取れます。
- Block Rabbit編集部:
このような新しいシステムの作成においては、何かテンプレのようなものを提供するのでしょうか?
- Rob:
そうですね。デプロイしやすいように、テンプレなものがあるとイメージしていただければと思います。
- Block Rabbit編集部:
データのセキュリティはどのように確保されているのでしょうか?自分の心身に関するもの等、いくつか繊細で機密な情報を含む場合が想定されますが、どのように対応するのでしょうか?
- Rob:
データ自体は暗号化されて、提供者はプライベートキーを保有することとなります。また、録音したデータごとに、提供するか否かの判断をすることが可能で、信頼した開発者のみにデータを提供することも可能です。もしくはゲートキーパーに自分のデータ管理を委任することも可能です。
基本的に、ネットワーク上のデータはパブリックリソースとなります。したがってユーザーは自分が他の人に提供してもいいと思うデータのみを提供することとなります。データのアクセス管理はユーザーを安心させるオプションとなっています。
- Block Rabbit編集部:
理解しました!ちなみにユーザーに与えられる文章ってどのように造られているのでしょうか?何かプログラムみたいなものがあるのでしょうか?
- Hadar:
キャンペーンにおける文章は、そのキャンペーンを主催したパートナー様が依頼した文章です。
- Block Rabbit編集部:
適当な録音を提出した場合、報酬って貰えちゃうのでしょうか?それとも何かチェック機能があるのでしょうか?
- Rob:
自動的に提供されたデータを精査するプログラムがありますので、それがチェックをしてくれます。不明瞭な場合は、人が直接聞いて判断します。
まとめ
Block Rabbit編集部が日本語の美しさと特異性について熱く語ったところ、なんと日本語版の実装も検討してくれるとのことです!
これはもう、読者の皆様も始めるしかないですね!
以上ラングネットについて記載してきましたが、音声認識の分野は非常に注目すべき領域だと確信しています。いずれは入力作業の大分部が音声で賄われる時代がやってくるとまで言われている中、どれだけ多くの、そして高品質の音声を集められるかという仕組みづくりはとても重要です。
自分がデータを提供することで、お金が貰える。この概念は非常に新鮮で、無料でユーザーのデータを搾取するGAFAよりも、ユーザーにデータを提供させる動機づけとして充分だと思われます。
また、集められたデータはブラックボックスに収められることはなく、透明性の高いオープンソースなプラットフォームに集積され、自分の許可したもののみが利用されるのです。
ユーザーが安心して、そしてちゃんと報酬を受け取れるラングネットの言語ネットワークは、データの取扱いに揺れるIT業界で新常識を提示するものでしょう。
ブロックラビットや今回ご紹介したLangnetさんにご質問などありましたら、いつでもブロックラビットのテレグラムチャンネルでご連絡ください!
ブロックラビットのテレグラムチャンネル