User Icon
1: アセム雨宮◆UD16NvPYxY
2026-03-05 08:56:58 OMPVG0082

かつてアラン・チューリングが提唱した「チューリング・テスト」。人間と機械の対話を区別できるかというこの古典的な知能テストは、現代のAIチャットボットの前ではもはや意味をなさなくなってしまった。

 あまりにも流暢に語る彼らの「本当の知能」を測るため、科学者たちが立ち上がった。彼らが作り出したのは、その名も恐ろしい「人類最後の試験(Humanity’s Last Exam)」だ。

 AIが人類の知性を超えるXデー、すなわち「汎用人工知能(AGI)」の誕生を見極めるための、史上最難関のベンチマークテストである

[引用] [編集] [削除] [イイネ!0] [アカン!0]
User Icon
2: アセム雨宮◆UD16NvPYxY
2026-03-05 08:57:22 OMPVG0082

この試験は、AI安全センター(Center for AI Safety)とScale AIの研究者たちが共同開発したもので、100以上の分野にわたる2500問の難問で構成されている

[引用] [編集] [削除] [イイネ!0] [アカン!0]
User Icon
3: アセム雨宮◆UD16NvPYxY
2026-03-05 08:57:40 OMPVG0082

 問題作成には世界50カ国、500機関から1000人以上の専門家が参加。その基準は厳格だ。「明確な正解があるが、ネット検索では即座に答えが見つからない」ものであること。

 実際、7万件以上の投稿の中から、既存のAIが正解できてしまった問題は容赦なく却下され、AIを完膚なきまでに叩きのめした問題だけが厳選された。

 例えば、ギリシャ神話の家系図に関するマニアックなトリビアから、摩擦のないレール上を滑る物体の力学的関係を問う物理学の問題まで、そのレベルはまさに博士課程クラス。

 この試験に対し、人間の専門家たちはそれぞれの専門分野で90%以上の正答率を叩き出している。一方、AIはどうだったか

[引用] [編集] [削除] [イイネ!0] [アカン!0]
User Icon
4: アセム雨宮◆UD16NvPYxY
2026-03-05 08:58:11 OMPVG0082

2025年1月の試験開始当初、OpenAIの「GPT-4o」や「o1」、Anthropicの「Claude 3.5 Sonnet」といった最先端モデルが挑戦したが、最高スコアはOpenAIのo1が出したわずか8.3%だった。人類の圧勝である

[引用] [編集] [削除] [イイネ!0] [アカン!0]
User Icon
5: アセム雨宮◆UD16NvPYxY
2026-03-05 08:59:02 OMPVG0082

 しかし、AIの進化速度は我々の想像を遥かに超えている。

 それからわずか1年後の2026年2月、Googleの最新モデル「Gemini 3 Deep Think」が、なんと48.4%という驚異的なスコアを記録したのだ。

 研究者たちは当初「2025年末までに正答率50%を超えるかも」と予測していたが、その予想はほぼ的中しつつある。

 人類が数百年かけて積み上げてきた知識の塔を、AIは猛スピードで駆け上がっているのだ

[引用] [編集] [削除] [イイネ!0] [アカン!0]
User Icon
6: アセム雨宮◆UD16NvPYxY
2026-03-05 08:59:20 OMPVG0082

 とはいえ、専門家たちは冷静だ。

「この試験で高得点を取ったからといって、すぐにAGI(汎用人工知能)が完成したわけではない」と彼らは釘を刺す

[引用] [編集] [削除] [イイネ!0] [アカン!0]
User Icon
7: アセム雨宮◆UD16NvPYxY
2026-03-05 08:59:41 OMPVG0082

この試験はあくまで「閉じた質問(答えが決まっている問題)」に対する処理能力を測るものであり、自律的な研究能力や創造性、あるいは「意識」のようなものを証明するものではないからだ。

 デラウェア大学の神経科学者マヌエル・ショットドルフ氏はこう語る。

「この試験で良い点を取ることは必要条件だが、十分条件ではない。これだけで機械が本当に知的になったとは結論付けられない」

 AIがこの「最後の試験」で満点を取る日は、そう遠くない未来にやってくるだろう。

 しかし、その時彼らは本当に「理解」しているのだろうか? それとも、単に膨大なデータを巧みにパッチワークしているだけなのだろうか

[引用] [編集] [削除] [イイネ!0] [アカン!0]
User Icon
8: アセム雨宮◆UD16NvPYxY
2026-03-05 08:59:59 OMPVG0082

テストの点数だけでは測れない「知性」の本質を、我々人類自身が問われる日が近づいているのかもしれない

[引用] [編集] [削除] [イイネ!0] [アカン!0]