私の家族の例からも分かるように、世の中には様々な動画が存在し、そしてそれを見たいと思う人がいます。YouTube のおすすめ動画システムが担う役割は、そのユーザーを見つけ出すことです。広大な図書館にある膨大な量の本の中から司書の助けなしで読みたい本を見つけることはとても困難です。YouTube では、おすすめ動画から視聴に至るユーザーがほとんどです。これは、登録チャンネルや検索から視聴に至る数をはるかに上回ります。私は、10 年あまりにわたっておすすめ動画システムの構築に携わってきました。おすすめ動画が YouTube の視聴体験の欠かせない要素となったことをとても嬉しく思います。その一方で、おすすめ動画システムは謎に満ちたブラック ボックスと捉えられることもあります。このシステムについて皆さんに広く知ってもらいたいと思い、今回はおすすめ動画の仕組みやこれまでの発展の経緯のほか、おすすめ動画の責任を YouTube が最優先事項としている理由を説明させていただきます。
おすすめ動画システムとは
おすすめ動画システムの基礎になっているのは、ユーザーが見たいと思い、価値を得られる動画を、見つけてもらいやすくするというシンプルな原則です。おすすめ動画は、主にホーム画面と [次の動画] パネルの 2 か所で利用されています。ホーム画面とは、YouTube を開いたときに最初に出るページです。個々のユーザーに応じてカスタマイズされたおすすめ動画、登録チャンネル、最新のニュースと情報が表示されます。[次の動画] パネルは、動画の視聴中に表示され、視聴している動画に基づく追加のコンテンツとともに、そのユーザーが興味を持つであろうその他の動画が提案されます。
2008 年におすすめ動画システムの構築を始めた頃は、現在とは全く異なるものでした。主に料理動画を視聴しているユーザーに対して、全体で人気の高い最新のスポーツ動画や音楽動画ばかりがホーム画面でおすすめとして表示されている状態でした。人気度に基づいて動画がランク付けされ、全体で単一の 「急上昇」ページが生成されていたのです。それらの急上昇動画を視聴したユーザーの数はさほど多くなく、YouTube のユーザー数の大半は、検索または外部の共有リンクから生み出されていました。
今日では、数十億本もの動画がシステムによって分類され、ユーザーが興味を持つ対象に応じてコンテンツがおすすめされています。例えば、私が USC の往年のアメリカンフットボール試合のハイライトを視聴したことが認識されると、私の少年期に行われたその他のスポーツ試合のハイライト動画がおすすめされます。おすすめ動画システムがなければ、この様な動画の存在を決して知らなかったでしょう。他のプラットフォームとは異なり、YouTube は単純に他のユーザーが見た動画だからといって、それをあなたにおすすめしたりはしません。YouTube のおすすめ動画システムが成功を収めた決め手は、ユーザーの視聴したい動画を高い精度で予測する能力です。
どのユーザーについても、その人固有の視聴傾向があるという認識から開発を始めました。そこで、ユーザーの視聴傾向を他の類似ユーザーと比較し、その情報に基づいて、ユーザーが視聴するかもしれない他のコンテンツを提案することにしました。例えば、あなたがテニス動画を好んでいたとして、同じテニス動画を好きな他のユーザーがジャズ動画も視聴していたとすれば、ジャズ動画があなたのおすすめ動画に表示される可能性があります。これは、ジャズ動画をそれまでに一度も視聴したことがなかったとしてもです。(ニュースや情報などのカテゴリについては異なる場合があり、それは後ほど取り上げることにします。)数年前、私の娘に Tyler Oakley の動画がおすすめされたことがありました。理由は、Vlogbrothers を当時見ていたユーザーの多くが Oakley の動画も見ていたためです。結果として、娘は Oakley の熱烈なファンになり、後に娘を連れて出かけた交流会では Oakley との対面を果たすことができました。
とは言え、当然ながら、このような情報を YouTube と共有することを誰もが望んでいるわけではないことも承知しています。そこで、どの程度のデータを YouTube に提供するか決められる管理ページを作成しました。YouTube の検索履歴と再生履歴をいつでも一時停止、編集、削除できます。
YouTube がおすすめ動画をカスタマイズする方法
個々のユーザーに合わせたおすすめ動画を提示するための「レシピ」があるわけではありません。おすすめ動画システムは絶え間なく進化していて、シグナルと呼ばれる 800 億件以上もの情報から日々学習しています。ですからおすすめ動画システムの計算式を公開することが、おすすめ動画に関する透明性を公表することにはなりません。システムに集まるすべてのデータを理解することが必要です。クリック数、総再生時間、アンケートへの回答、共有、高評価、低評価など、いくつかのシグナルが相互に作用して、ユーザーの満足度をシステムに伝えています。
●クリック数: ユーザーは大抵の場合、視聴したい動画をクリックするので、クリックした動画に満足感を覚える可能性が高いです。しかし、動画がクリックされたからといって、実際に視聴されたわけではないということは 2011 年からわかっています。例えば、あなたが、ある年のウィンブルドン選手権のハイライトを検索していたとします。ページをスクロールしていき、試合の映像が含まれていることを示唆するサムネイルとタイトルが付けられている動画を見つけ、それをクリックします。しかし、現れたのは部屋で試合について語る人物でした。その後、[次の動画] パネルに表示されるおすすめ動画をクリックしてみると、今度は別のファンが試合について語っているだけでした。それらの動画を次々とクリックしていき、ようやく、見たかった試合の映像が含まれる動画がおすすめされました。このようなケースを考慮し、2012 年に総再生時間という指標を追加しました。
●総再生時間: 総再生時間は、特定のユーザーがどの動画をどの程度の時間にわたって視聴したかを示すものです。そのユーザーが何を視聴する可能性が高いのか、個々人に基づいてカスタマイズされたシグナルを得られます。つまり、あるテニスのファンがウィンブルドンのハイライト映像を 20 分間視聴し、試合分析の動画は数秒間しか視聴しなかった場合、このファンは、試合ハイライト動画を視聴することを好むと想定できます。
総再生時間をおすすめ動画の指標としてとり入れた当初は、視聴回数がすぐに 20% 減少しましたが、YouTube にはユーザーにとってより高い価値を提供することのほうが重要であるという信念がありました。一方で総再生時間が長いからと言って価値ある時間を送ったとは限りません。私はたまに YouTube を見ながら夜更かしをします。その時間を使って、YouTube で新しい言語を学んだり、料理動画を見て料理の腕を磨いたりできたかもしれませんが、そうはせずに無作為に選んだ動画を見て過ごすことがあります。YouTube の開発陣は、ユーザーが時間をかけて視聴した動画に失望する姿を目にしたくはありません。ユーザーが YouTube で過ごす時間に対してどれくらいの価値を感じているのかを測定するためにもっと他のことをしないといけないと感じました。
●アンケートへの回答: 視聴しているコンテンツにユーザーが本当に満足しているかを確認するために「有意義な視聴時間」を測定の対象としました。これは、ユーザーが有意義であると捉えている動画の視聴に費やされた時間で、ユーザー アンケートを使用してそれを測ります。視聴した動画を星 1 〜 5 つでユーザーに評価してもらい、そのコンテンツへの満足度を判断するための指標とします。評価が星 1 〜 2 つの場合は、低評価の理由を質問します。星 4 〜 5 つの場合は、刺激を得られたり、有意義であったか、という質問をします。星 4 つまたは 5 つの高評価となった動画だけが、「有意義な視聴時間」のカウント対象になります。
当然ながら、誰もが視聴動画のすべてのアンケートに回答するわけではありません。得られた回答に基づいて全ユーザーのアンケート回答を予測できるように機械学習モデルをトレーニングさせした。これらの予測の精度を検証するため、トレーニングの際は回答の一部を意図的に伏せています。この手法により、実際の回答にどの程度まで近づいているのかが常に確認できます。
●共有、高評価、低評価: 概して、ユーザーが動画を共有または高評価した場合、その動画に満足している可能性が高いと言えます。この情報は、ユーザーがさらに別の動画を共有・高評価するかを予測するために利用されます。ユーザーが低評価を付けた場合、そのユーザーにとってその動画が楽しめないものであったことを示唆するシグナルになります。
おすすめ動画と同様に、個々のシグナルの重要度はユーザーによって異なります。星 1 つまたは 2 つと評価したものも含めて、視聴したあらゆる動画を共有するタイプのユーザーに対しては、共有の履歴の比重は低い仕組みになっています。これらすべての挙動からわかるとおり、YouTube のおすすめ動画システムは決まった計算式に従っているわけではなく、ユーザーの視聴習慣の変化に伴って発展しています。
信頼の置けるおすすめ動画の提供
クリック数、視聴回数、総再生時間、ユーザー アンケート、共有、高評価、低評価は、YouTube で多く視聴されている音楽やエンターテイメントなどのコンテンツのおすすめ動画を表示する上で非常に役立ちます。一方、ニュースやあるトピックに関する情報収集のために YouTube にアクセスするユーザーも年々増えています。ニュース速報や複雑な科学的研究といったトピックで重視すべきは、情報の質と文脈です。「地球は平面である」と主張する動画にとても満足したと言う人もいますが、この様な質の低いコンテンツをおすすめしてしまうことは、YouTube の本意ではありません。
おすすめ動画が極めて重要な役割を担っているのは、信頼の置けるプラットフォームを維持するためです。おすすめ動画はユーザーを信頼できる情報へとつなげて、問題のあるコンテンツが表示される可能性を最小限に抑えます。また、これは、YouTube で何が許され、何が許されないかを定めた確固たるコミュニティ ガイドラインによる取り組みを補完するものでもあります。
YouTube は 2011 年、際どいコンテンツや暴力的なコンテンツを識別し、それらがおすすめ動画として表示されることを防止するための分類システムを確立しました。2015 年には、センセーショナルなコンテンツがホーム画面に表示されていることを認識し、それらの表示順位を下げるための措置を講じました。その 1 年後には、未成年者が不適切な形で登場する可能性のある動画を予測し、そのような動画をおすすめ動画から削除する仕組みを導入しました。2017 年には、LGTBQ+ などの保護されるべきコミュニティにとっておすすめ動画システムが、公正に機能するために機械学習の性能を確認しました。
昨今の誤情報の増加により、おすすめ動画システムの活用範囲をさらに拡大して、問題のある誤情報とガイドラインのボーダーライン上のコンテンツ(明らかなコミュニティ ガイドライン違反ではないものの、違反に近いコンテンツ)を対象に含めました。「人類の月面着陸はねつ造だ」と主張する陰謀論の動画や、「オレンジジュースで癌を治せる」などと言った誤った情報を拡散しようとするコンテンツも含まれます。
分類システムによって、動画が「信頼できるコンテンツ」と「ガイドラインのボーダーライン上のコンテンツ」のどちらであるかを審査しています。各チャンネルや動画にある情報の質を目視で分類しています。審査担当者は世界のさまざまな地域の出身であり、公開されている評価ガイドライン(英文)に沿ってトレーニングを受けています。健康に関する情報が含まれているコンテンツの場合は、医師など資格を有する専門家の意見も取り入れています。
審査担当者はいくつかの重要事項を確認して信頼性を判断します。コンテンツは、その中に盛り込まれた約束を果たしているか、または目標を達成しているか。動画にある目標を達成するには、どのような専門知識が必要か。チャンネルそのものと、動画に登場している話し手は、どのような評判か。動画の主なトピックは何か(例:ニュース、スポーツ、歴史、科学など)。コンテンツは主に風刺を意図しているものか。これらの質問を確認して、動画がどの程度信頼できるものかを判断します。ニュースや情報コンテンツに関しては、スコアが高いほど動画の順位が上がります。
ガイドラインのボーダーライン上のコンテンツかどうかを見極めるために、審査担当者は、コンテンツが不正確か、誤解を招くものか、扇動的か、配慮に欠けるか、有害または、害を生じる恐れがあるかなど、これらに限らず、さまざまな要素を評価の対象としています。結果を総合的に勘案して、有害な誤情報が含まれていたり、ガイドラインのボーダーライン上のコンテンツである可能性がどの程度あるかというスコアを算出します。ガイドラインのボーダーライン上のコンテンツであると分類された動画は、おすすめ動画での順位が引き下げられます。
人の目によるこれらの審査結果が反映されるように YouTube のシステムをトレーニングし、目視審査を YouTube のすべての動画に拡大させています。
おすすめ動画に関してよくある質問への回答
おすすめ動画は、ユーザーの嗜好に合うコンテンツを紹介し、クリエイターと新たなユーザーを結ぶという重要な役割を、YouTube のコミュニティ全体で果たしています。より広範な社会全体に対しては、有害な誤情報の拡散を食い止めるうえで、おすすめ動画は効果的です。クリック数、総再生時間、ユーザー アンケート、共有、高評価、低評価は、システムに情報を送る上で重要なシグナルですが、それを覆すのが、YouTube コミュニティと社会に対して YouTube が責任を果たすためのコミットメントです。
おすすめ動画システムに関してよく寄せられる質問のうち、ここで取り上げておくべきものをいくつか紹介します。
- ガイドラインのボーダーライン上のコンテンツは、エンゲージメントが高いのでしょうか?
実のところ、アンケートやフィードバックによれば、大多数のユーザーはガイドラインのボーダーライン上のコンテンツをおすすめされたくないと考えていて、多くの人が不快感を覚えています。事実、卑わいなコンテンツやゴシップ系のコンテンツの順位を下げると、制限を何も課さなかった場合と比べて、総再生時間は 2.5 か月で 0.5% 増加しました。
また、ガイドラインのボーダーライン上のコンテンツが他のタイプのコンテンツよりも概してエンゲージメントが高いことを示す証拠も、一切発見されていません。例えば、「地球は平坦である」と主張する動画は、「地球は丸い」と主張する動画と比べてアップロード数がはるかに多い一方、平均的な視聴回数ははるかに少なくなっています。アンケートによれば、ガイドラインのボーダーライン上のコンテンツに満足している人は、YouTube のユーザーのごく一部にすぎません。この種のコンテンツが、YouTube のおすすめ動画システムでユーザーに広く届かないように、YouTube は時間と費用を投資してきました。現状、ガイドラインのボーダーライン上のコンテンツは、おすすめ動画経由以外からの流入が多いです。
ガイドラインのボーダーライン上のコンテンツは、YouTube で総再生時間を伸ばしているのでしょうか?
ガイドラインのボーダーライン上のコンテンツの視聴は、圧倒的多数のユーザーにとって有意義な時間だったという評価には繋がりません。ガイドラインのボーダーライン上のコンテンツについて、2019 年におすすめ動画での順位を引き下げ始めたのは、これが理由です。以後、登録チャンネル以外では、そのようなおすすめ動画の総再生時間は米国で 70% 減少しています。今日、YouTube のおすすめ動画に基づいて視聴されるガイドラインのボーダーライン上のコンテンツが占める割合は、1% を大幅に下回っています。
ますます過激化するコンテンツに、ユーザーがおすすめ動画によって誘導されることはありますか?
すでに説明したとおり、質の低いコンテンツについてはおすすめ動画での順位を積極的に引き下げています。それと同時に、ユーザーの興味を引くトピックで信頼できる動画を積極的にユーザーに紹介しています。たとえば、私が新型コロナウイルス感染症のワクチンに関する動画を視聴しているとしましょう。[次の動画] パネルに表示されるのは、 Vox や Bloomberg Quicktake といった信頼の置ける情報源の動画です。ワクチンに関する誤った情報が含まれている動画は(YouTube のシステムで検出できる限りにおいて)表示されません。YouTube で視聴するニュースや政治コンテンツは、どちらかと言えば、オンラインでの習慣全体にわたって見受けられる個々人の嗜好が表れたものです。
新型コロナウイルス感染症に関するニュースや解説動画に加えて、個人の視聴履歴に基づいてカスタマイズされたその他のトピックのおすすめも表示されます。私の場合ですと例えば Saturday Night Live での一幕や、スーパーマリオ効果に関する TEDx Talk などです。個々人に応じてカスタマイズが施される多様性のおかげで、同じ類の動画を何度も視聴するのではなく、新たなテーマの動画に触れることができます。
ガイドラインのボーダーライン上のコンテンツは収益を生み出しているのですか?
まず、YouTube の広告掲載に適したコンテンツのガイドラインでは、ガイドラインのボーダーライン上のコンテンツの多くについて、すでに収益化が禁じられています。多くの広告主は、YouTube 上でこの種のコンテンツと関連付けられることを望んでおらず、多くの場合、このようなコンテンツへの広告掲載を無効にしています。つまり、ボーダーライン上の動画が視聴されるたびに収益獲得の機会が失われていることになり、YouTube にとっては、実際の収益喪失につながっています。さらに、この種のコンテンツは不信感をあおり、広告パートナーのみならず、一般社会、報道機関、政策立案者に対する懸念も増幅させます。YouTube の責任が増えたと同時に、YouTube もクリエイターエコシステムも大きくなりました。責任を全うすることは、ビジネスに資する行為とも言えるのです。
これらすべてを勘案したうえで、YouTube がガイドラインのボーダーライン上のコンテンツを単純に削除しないのはなぜでしょうか。誤情報は瞬く間に移り変わって発展する傾向があり、テロや子どもの安全といった分野とは違って、明確な共通認識が定まっていません。また、個々人の観点や背景によって何が誤情報となるかは異なります。結果として、賛否の分かれるコンテンツや不快感を与えるコンテンツが放置されている場合もあることを、YouTube は認識しています。このため、信頼の置けるおすすめ動画システムの構築に引き続き注力し、このようなコンテンツがシステムによって幅広くおすすめ動画として紹介されないように対策を講じています。
おすすめ動画に関する責任の総合的な取り組みは、目に見える形で効果が表れています。信頼できるニュースの総再生時間は飛躍的に伸び、ボーダーライン上にあるコンテンツの視聴は減少しています。これで一件落着となるわけではなく、システムの持続的な改善に向けて工夫や投資を継続しなければなりません。YouTube では、ガイドラインのボーダーライン上のコンテンツがおすすめ動画をきっかけとして視聴される回数を、全視聴回数の 0.5% 未満とすることを目指しています。
YouTube の使命は、表現する場所をあらゆる人に提供し、その声を世界中に届けることです。YouTube は、私の家族にも大きな影響を与えてくれました。寛容や共感を説く動画は、娘の人格形成に少なからず好ましい影響を与えました。息子は、線形代数についての数学の授業で苦労していましたが、お陰で難題を理解することができました。私自身は、テクノロジー倫理の第一人者の方々による講義から、多くの背景情報と微妙な差異について学びました。YouTube はオープンな場を維持することに努めており、YouTube がなければ発表の場が生まれなかったであろう新たな見方や発想の源泉となっています。Marques Brownlee、MostlySane、NikkieTutorials といったクリエイターは、自身の専門知識、発信、率直さによって数百万人を鼓舞し続けています。
YouTube のおすすめ動画システムは、ユーザーから寄せられるフィードバックをもとに日々改善していますが、いっそうの改良の余地は常に存在しています。これからも私のチームと私自身は、おすすめ動画システムが絶えず適切に機能し、ユーザーに最大限に有用で有益な体験をお届けできるよう努めます。
--- YouTube エンジニアリング担当バイスプレジデント クリストス・グッドローより