人工知能(AI)システムは、今後数年間で人々の働き方を大きく変えるだろう。AIが労働市場と経済に与える長期的な影響をより深く理解するため、Anthropicは「Anthropic Economic Index」(アンソロピック Economic Index)の研究プロジェクト。
に基づくインデックスの第一報。 クロード.aiプラットフォーム上の何百万もの匿名の会話から得られたデータは、最先端のデータ洞察と分析を提供する。この報告書は、AIが現代経済のタスクにどのように適合するかについて、これまでで最も明確な姿を明らかにしている。このレポートのデータ量と分析の深さは前例がなく、AnthropicはAI経済効果研究のリーダーとしての地位を確立しようとしているようだ。
Anthropicはさらに、この分析を支えるデータセットを公開し、研究者がそれを基に研究を進められるようにした。コメンテーターは、この動きは、AIの経済的影響に関する研究への幅広い学術的参加を奨励するAnthropicのオープンな姿勢を示すものだと指摘している。来るべき労働市場の移行、そして雇用と生産性への潜在的な影響は、多角的な政策対応を必要とする。このため、Anthropicは、経済学者、政策専門家、他分野の研究者が、本指標の今後の研究に彼らの洞察を提供することを求めている。
経済指標の第1回報告書の主な調査結果は以下の通り:
- AIアプリケーションの業界集中: 現在、AIの利用はソフトウェア開発とテクニカルライティングが中心となっている。コメンテーターによれば、これらのデータは、特定の知識ベースの仕事にAIが浸透していることを最初に確認するものであると同時に、AIの応用にはまだ大きな可能性が残されていることを示している。
- 強化されたアプリケーションが主流だ: AIが直接タスクを実行する自動化モード(43%)に比べ、AIの応用は増強モード(57%)に重点が置かれている。つまり、AIは人間と協働し、検証、学習、タスク反復の分野で人間の能力を増強する。アナリストは、これは現在のAI技術が人間の仕事を完全に置き換えるのではなく、人間を補助するのに適していることを示しており、人間と機械のコラボレーションが将来的にしばらくの間、主流の作業モードになる可能性が高いと解釈している。
- AIの用途と給与水準: AIは、コンピュータ・プログラマーやデータ・サイエンティストなど、中・高賃金の職業に関連する業務でより一般的に使用されている。しかし、低賃金や高賃金の職種ではAIの利用は比較的少ない。専門家は、これは現在のAI能力の限界や、各業界におけるAI技術の採用に対する現実的な障壁を反映しているのではないかと推測している。さらに、AI技術は、一定レベルの複雑さを持ちながらも、創造性や対人スキルを過度に重視しない仕事に適している可能性が示唆された。
Anthropicの最初の調査結果をより深く見るために、次のセクションではAIが労働市場でどのように利用されているかを詳しく説明する。
Claude.aiの実際のユーザーデータから、AIが様々な経済分野でどのように使われ、応用されているかを紹介。グラフの数字は、特定のタスク、職業、カテゴリーに関連するクロード関連の会話の割合を表しています。
労働市場におけるAIの姿を洞察する
Anthropicの最新の研究論文は、技術革新と労働市場の関係についての長期的な研究に基づいている。技術の進歩は、産業革命のジェニースピニングマシンから今日の自動車製造ロボットまで、労働環境を再構築しており、AnthropicはAIがもたらす変革的影響に焦点を当てている。従来のアンケートや将来予測とは異なり、AnthropicはAIが実際にどのように使われているかという直接的なデータを持っている。批評家は、このアプローチは主観性のバイアスを避け、ユーザーの行動データから直接抽出するため、調査結果がより客観的で説得力のあるものになると主張している。
職業作業分析の方法論
Anthropicのアプローチは、経済学の文献における重要な洞察に由来している。異なる仕事には、ある種のタスクやスキルが共通して含まれていることが多い。例えば、視覚的パターンを認識する能力は、デザイナー、写真家、警備員、放射線技師などの職業が共通して必要とするタスクである。このようなタスク中心の分析視点は、技術変化が労働市場に与える構造的影響をより精緻に捉えることができると指摘されている。
新しい技術によって自動化されたり、強化されたりする可能性のあるタスクの種類には違いがある。その結果、Anthropicは、AIが様々な職種の特定のタスクに選択的に適用されると予測している。仕事全体を分析するのではなく、仕事を分析することで、AIがどのように徐々に経済に統合されていくかをより包括的に理解することができる。
クリオ・システム:AIアプリをキャリア・ミッションにつなげる
この研究は、Anthropicが開発した自動分析ツールClio(Claude Insight & Observation)の恩恵を受けた。Clioは、ユーザーのプライバシーを保護しながら、ユーザーとClaudeの会話データを分析することができる。Anthropicは、Clioシステムを使用して、約100万人のClaudeとの会話(具体的には、Claude.aiプラットフォーム上のFree版とPro版の両方の会話)を分析した。Anthropicは、Claude.aiプラットフォーム上の無料版とPro版の両方の会話を分析するためにClioシステムを使用し、約100万人のユーザーとClaude.aiとの会話を分析しました。レビュアーは、ユーザーのプライバシーを厳格に保護しながら、膨大な対話データから貴重な経済情報を抽出できたClaioシステムの利用を、この研究のハイライトとして高く評価している。
Anthropicの調査チームは、米国労働省が開発した職業分類システムをベンチマークとし、労働省が管理する職業情報ネットワークを参照した。NET(職業情報ネットワーク)データベース。クリオ・システムは、各ダイアログをO.NETタスクのエントリーがマッチングされる(プロセスを以下に示す)。Anthropicは次にO.NETの分類フレームワークでは、タスクをさらにそのタスクを代表する職業にグループ分けし、職業を「教育と図書館」、「ビジネスと金融」などのより広範なカテゴリーに分類している。
AnthropicのClioシステムは、クロードとの会話(データは極秘にされた;左上)を職業タスクに変換し(中上)、さらにO*NETに由来する職業/職業カテゴリーに変換した(右上)。これらのデータはその後、さまざまな分析に使用された(下段;詳細は後述)。
調査結果
AIアプリケーションの職種別分布。 Anthropicのデータセットの分析では、AIの採用率が最も高いタスクと職業は、主にソフトウェアエンジニアリング関連の仕事をカバーする「コンピュータと数学」カテゴリーに集中していた。クロードに寄せられたユーザーからの問い合わせのうち37.2%がこのカテゴリーに属し、ソフトウェアの修正、コードのデバッグ、ネットワークのトラブルシューティングなどのタスクをカバーしている。このレビューでは、ソフトウェアエンジニアリング分野がAI導入の最前線にいることは驚くことではないと指摘している。
2番目に多いカテゴリーは「アート、デザイン、スポーツ、エンターテインメント、メディア」(ユーザーからの問い合わせの10.3%)で、これはユーザーがあらゆるタイプのライティングや編集作業にクロードを活用していることを大きく反映している。アナリストはこれを、AIがクリエイティブ業界、特にコンテンツ制作の分野でも存在感を示し始めていることの表れだと見ている。予想通り、「農業・漁業・林業」(ユーザーからの問い合わせのうち、わずか0.1%しか占めなかった)のような手作業が多い職業は、AI導入の割合が最も低かった。
Anthropicはまた、自社のデータセットにおける各職種のAI導入率と、労働市場全体におけるそれらの職業のシェアを比較した。その結果を下図に示す。
各職種について、オレンジ色の棒はクロードに関連した会話の割合を、灰色の棒はその職種を持つ労働者の米国経済における割合を表している(米国労働省のO*NET職業分類によるデータ)。
キャリアにおけるAI導入の深さ。 Anthropicの分析によると、AIを関連するタスクのほとんどに深く使用している職種はごく少数であることが明らかになった。データによると、少なくとも75%のタスクにAIを適用している職種は約4%に過ぎない。しかし、より控えめなAIの適用ははるかに普及しており、約36%の職種が少なくとも25%のタスクにAIを使用し始めている。コメンテーターによると、これはAIの導入がまだ初期段階にあり、深い適用はまだ普及していないが、浅い適用は浸透し始めていることを示している。コメンテーターによると、これはAIの導入がまだ初期段階にあり、深いアプリケーションはまだ普及していないが、浅いアプリケーションは幅広い業界に浸透し始めていることを示唆している。
Anthropicの予想通り、このデータセットでは、AIによって仕事が完全に自動化される兆候は見られない。その代わりに、AIは経済活動の多くのタスクセグメントに徐々に浸透しており、一部のタスクグループが他よりも影響を受けているに過ぎない。アナリストによれば、これは、現在のAI技術が、仕事レベルの代替よりも、タスクレベルの強化を支持していることのさらなる証拠だという。
AI導入と給与水準の関係。 O*NETデータベースは、米国の各職業の年間給与の中央値に関するデータを提供しています。Anthropicは、この情報を分析フレームワークに組み込み、各産業の給与の中央値とAIが関連業務にどの程度使用されているかを比較できるようにしています。
興味深い発見のひとつは、低所得者層と超高所得者層(美容師や産婦人科医など、一般的に高度な手作業スキルを必要とする職種)の両方において、AIの利用率が比較的低いことだ。対照的に、コンピュータ・プログラマーやコピーライターなど、中・高所得層に属する特定の職業では、Anthropic社のデータでAIへの依存度が高いことが示された。観察者たちは、この現象は示唆に富んでいるとコメントしている。AIは中間技能、中間所得の知識ベースの仕事に適用される可能性が高い一方で、高度な手作業技能や極めて専門的な知識を必要とする仕事では相対的に代替性が低いことを示唆している。
このグラフは、ある職業の年収の中央値(x軸)と、その職業を含むクロード・ダイアローグの割合(y軸)の関係を示しており、代表的な職業をいくつか取り上げている。
自動化と強化の内訳。 Anthropicはまた、タスクがどのように「実行」されるのか、具体的には、どのタスクが「自動化」(ドキュメントのフォーマットなど、AIが直接タスクを実行する)される傾向があり、どのタスクが「拡張」(AIがユーザーと協力してタスクを完了する)される傾向にあるのかについても深く考察している。書式設定など)、どのタスクが「拡張型」(AIがユーザーと協力してタスクを完了させる)なのか。
全体として、研究結果は「強化」モデルにやや有利であった。分析対象となった全タスクのうち、57%は増強アプリケーションに属し、43%は自動化アプリケーションに属している。つまり、アプリケーションシナリオの半数以上において、AIの役割はタスクの実行において人間に取って代わることではなく、検証(例:ユーザーの作業成果物のレビュー)、学習(例:ユーザーの新しい知識やスキルの習得の支援)、タスクの反復(例:ユーザーのブレーンストーミングや実行の支援)に従事することで人間と「相乗」することである。(例えば、ユーザーのブレーンストーミングや反復的な生成タスクの実行を支援する)。専門家による分析によると、自動化されたアプリケーションよりも拡張されたアプリケーションの方がわずかに一般的であり、クロードのようなAIツールは現在、人間の労働力を直接置き換えることよりも、人間の生産性や創造性を高めることに重点を置いていることを示唆している。
図は、クロードとの対話における拡張アプリケーションと自動アプリケーションの割合と、各カテゴリー内のタスクのサブタイプの内訳の構成を示している。サブタイプの具体的な定義は、Anthropicの研究論文で説明されている。「インストラクション」:最小限の人間的インタラクションによるタスクの委譲、「フィードバックループ」:環境フィードバックによって導かれるタスクの完了、「タスク反復」:協調プロセスによるタスク実行の最適化学習」:知識の習得と理解、「検証」:作業結果の検証と改善。
研究の限界
Anthropicによるこの研究は、AIが労働市場をどのように再構築しているかを理解する上でユニークな視点を提供している。しかし、すべての調査と同様に、この調査にはいくつかの重要な限界がある。主なものは以下の通りである:
- 作業シナリオの定義: Anthropicは、ユーザーがタスクを実行するためにClaudeを使用することが仕事の領域であるかどうかを正確に判断することはまだできません。クロードに執筆や編集のアドバイスを求めるユーザーは、確かにタスクに取り組んでいるかもしれないが、単に個人的な趣味(例えば小説を書く)を満たしているだけかもしれない。コメンテーターは、これは固有の方法論的課題であり、ユーザーの対話データに基づくいかなる研究においても、仕事と非仕事のシナリオを完全に区別することは困難であると指摘している。
- ユーザー行動の解釈: 上記の問題と関連して、Anthropicはユーザーがクロードの回答結果を実際にどのように使っているのか理解していません。例えば、ユーザーはコードスニペットを直接コピー&ペーストしているのだろうか?回答内容を事実確認するのか、それとも無批判にそのまま受け入れるのか。Anthropicのデータでは、"自動化 "されているように見える特定のアプリケーションシナリオは、実際にはまだ "拡張 "モードかもしれない。例えば、あるユーザーがクロードにメモの代筆を依頼し(これは表向きは自動化されている)、その後自分で編集や推敲を行う(これは拡張である)。アナリストによれば、この「自動化されたシェル、人間のコア」現象は、自動化の度合いを過大評価することにつながる可能性があるという。
- データソースの限界: Anthropicは現在、Claude.aiのFreeプランとProプランのユーザーデータのみを分析しており、API、Team、Enterpriseユーザーのデータはカバーしていません。Claude.aiのデータには、仕事以外のシナリオからの対話が混ざっている可能性がありますが、Anthropicは言語モデルを使用してデータをフィルタリングし、職業タスクに関連する対話のみを保持する努力をしており、データの偏りの問題をある程度緩和しています。データ・フィルタリングの試みによって偏りはある程度緩和されたものの、Claude.aiの無料版とPro版のユーザー・データだけに頼っていては、企業レベルのAIアプリケーションの真の姿を完全に反映することは難しいかもしれない、と専門家は言う。
- タスク分類の誤り: タスクタイプの絶対数が多いため、Clioシステムは、分類プロセス中に対話の一部に誤ったタグを付けた可能性がある(Anthropicが分析結果をどのように検証したかについては、論文全文、特に付録Bを参照)。
- モデリング能力の限界: クロードには現在、画像を生成する機能がない(コードによる間接的なものを除く)ため、いくつかの創造的な画像関連のアプリケーションは調査データでは扱われていない。
- コーディングのユースケースを強調しすぎ: クロードが最も先進的なコーディングモデルの1つとして注目されていることから、Anthropicはコーディング関連のユースケースがデータで過剰に表現されている可能性があると予想しています。そのため、Anthropicは、現在のデータセットにおけるアプリケーションの分布が、全体的なAIアプリケーションの状況を完全に代表しているとは考えていません。特にクロードのプログラミングアシスタントとしての市場ポジションを考慮すると、ソフトウェア開発などの分野にデータ結果が偏る可能性がある。
結論と今後の研究の方向性
AI技術の利用は急速に拡大し、AIモデルの能力は成長し続けている。労働市場の状況は近い将来大きく変化する可能性が高い。その結果、Anthropicは、潜在的な社会的・経済的変化を追跡し続けるために、これらの分析の多くを長期的に繰り返すことを計画しており、Anthropicは、経済と社会に対するAIの広範囲に及ぶ影響を追跡・分析し続けるために、Anthropic Economic Index(Anthropicが永続させることを意図していると思われる研究プロジェクト)の一部として、結果と関連するデータセットを定期的に公表する予定である。Anthropicは、AIが経済や社会に及ぼす広範囲な影響を追跡・分析し続けるために、これを長期的かつ継続的な研究プロジェクトにするつもりであるようだ。
このような縦断的な分析は、AnthropicがAIと雇用市場の複雑な関係をより深く理解するのに役立ちます。例えば、Anthropicは職業内のAI導入の深さの傾向を動的に監視することができます。将来、AIが主に特定のタスクに適用され続け、大半のタスクにAIを深く適用する職種が少数にとどまるのであれば、将来の労働市場は、大量絶滅よりも既存職種の反復進化に傾くかもしれない。アンソロピックはまた、自動化と拡張アプリケーションの比率の変化を継続的に監視することで、自動化が普及しつつある分野のシグナルをタイムリーに捉えることができる。アナリストは、これらの主要指標の変化を長期的に追跡することで、AIが労働市場に与える影響が「破壊的な影響」なのか「漸進的な進化」なのかをより正確に判断できると考えている。
Anthropicの調査は、AIが実際にどのように利用されているかについての貴重なデータを提供するが、直接政策提言を行うものではない。AIが労働市場に与える影響にどう適切に備えるかという問題に対する答えは、孤立した研究結果だけから得られる可能性は低い。むしろ、様々な分野からのエビデンス、社会的価値観、実践経験の組み合わせが必要であり、Anthropicは、その新しい研究手法を使って、これらの重要な問題のより明確な理解に貢献することを期待している。Anthropicの最終的な目標は、単に学術的な研究を提供するだけでなく、将来の政策立案や社会対応戦略のための洞察を提供することである。
Anthropicの分析と調査結果の詳細については、以下をご覧ください。 論文全文.