「海外のAI研究者が「日本の某ゲームをプレイさせて」AIの真の推論能力を測定、わりと意外な結果が出てしまった模様」のコメントページ
-
1 名前:匿名
2025/04/17(木)
ID:NTc2OTg1N
逆に言えば、推理小説として破綻している作品を指摘できる、
あるいは破綻のない展開を提示できるかも? って期待がもてるな。 -
2 名前:匿名
2025/04/17(木)
ID:NTc2OTg1N
長編小説とか書いてると設定管理が甘いと矛盾とか結構起きたりするので、それを即座にチェックしてくれるAIとかあるとありがたい。
おとなはウソつきではないのです。
まちがいをするだけなのです…… -
3 名前:匿名
2025/04/17(木)
ID:MzUzMzQwM
うむ、自分はMetaに負ける自信があるな。
まあ昔から推理物は凄まじく駄目だから… -
4 名前:匿名
2025/04/17(木)
ID:MzUwNDM1N
「deepseek R1」は深読みし過ぎて明後日の方へ逝くタイプ?
-
5 名前:匿名
2025/04/17(木)
ID:MzQ4MjAzN
>その後逆裁のチートバグ動画を視聴させAIの脳を破壊します
バグ転裁判は更におもしろいからなw -
6 名前:匿名
2025/04/17(木)
ID:Mzk5Njk2M
面白いなこれ
ポートピア連続殺人事件とオホーツクに消ゆを頼む
どのタイミングで「分かる」のか知りたい -
7 名前:匿名
2025/04/17(木)
ID:MTQwOTc1M
霊視とかしてた様な気が
そのへん大丈夫そ? -
8 名前:匿名
2025/04/17(木)
ID:MTcyNDE4M
アメリカで活動してる中国人グループの研究結果w
なんかの政治的意図があるんだろうねぇ -
9 名前:匿名
2025/04/17(木)
ID:MzM5NTI1M
copilotと遣り取りしたところ全然推理能力がないと判っている。
金出して使うほどの必要性もないし。 -
10 名前:匿名
2025/04/17(木)
ID:NDM4NTQ3O
これは面白い実験なので他のゲームでもやって欲しいな
-
11 名前:匿名
2025/04/17(木)
ID:NDM4MTE4M
AIが「嘘」を見抜くのは感慨深いな
-
12 名前:匿名
2025/04/17(木)
ID:MzYwNjQ1N
ポケモンがAIの真の知性を測るのに最適という話は聞いたことがあるな
ポケモンというかRPG全般がそうだろうけど
特定のルールで競うアクションやRTSとかと違って、RPGは論理的な思考力が無いと進めないから
例え小学生が簡単に解けるような論理的問題でも、AIは解けなかったりするからな -
13 名前:匿名
2025/04/17(木)
ID:Nzk1NzEyO
助成金欲しさに何とでも言いよるな。
aiを誤解させたくてしょうがないのだろうが、ディープラーニングは元々判断のルールを言葉で表すことが難しい画像認識のような分野の処理を行うものなので、ルールを解釈する仕組みを持たない。
ディープラーニングが出す結論は確率でくっついたニューロンの結果なので、結論の導出過程や結論の正しさを人の言葉にする事が大変難しい。 -
14 名前:匿名
2025/04/17(木)
ID:NTAwNTczN
AIも単なる性能だけでなく個性で語られる時代が来るか
-
15 名前:匿名
2025/04/18(金)
ID:Mzk3MzUyM
※13
おもしろい指摘
ご指摘のようにAIはちょっと前まで病理診断での活用等が期待されてたはずが
なんか学生がレポート手抜きするのに手伝わされたりジブリアニメ作らされたりしてるけど
リリースされたAIが言語化やルールの理解把握を目的としてなくても
そうした活用が可能か、可能な場合はどの程度の精度で?て指標を求める人もいるんじゃないの
弁護士とか裁判官がいきなり不要にはならないけど、助成金欲しさって決めつけにはちょっとうなづけないな -
16 名前:匿名
2025/04/18(金)
ID:MzQ3NzMzO
本スレにもあったが、次のAI性能調査はかまいたちの夜でどうぞ。
恥ずかしながら、かまいたちの夜はことごとく野垂れじにでクリアできなかった自分でも、逆裁はクリアできたからw
(´・ω・`) -
17 名前:匿名
2025/04/18(金)
ID:NjM1ODY5O
>o1は推論モデルで複数の解析実行して整合性とるんだっけ。だから矛盾に気付きやすいとかあるんでしょうかね
enfielが書いてるこれ、o1は脳内多動のADHDと同じ思考タイプってこと?
話すタイミングを見計らうのが苦手なだけで、あれこれ並行して考える性質だし、気になる点を追求したくなる性質、似てない?
なお、言語能力が低い場合、AとBという事実からXYZの結論に到達する流れを他人に分かりやすく説明できないために「AとBの話題からいきなり無関係なXYZについて語りだす頭ちょっぴりおかしい天然」扱いされる。
逆に言語能力が高い場合、相手も同じタイプなら気持ちよく議論できるが、殆どの場合そうではないので「理屈っぽくて些細なことばかり気にする議論好きな面倒くさい人」扱いされる -
18 名前:匿名
2025/04/18(金)
ID:MzQzMTIyO
面白い考え
複数のジャンルをプレイさせて総合ベンチマークを取ることもできそうだ -
19 名前:匿名
2025/04/18(金)
ID:NjY4ODM1O
※13
将棋とかのAIも良さそうな手は教えてくれるけどなんでそうなったのかはブラックボックス状態だもんなあ・・・ -
20 名前:匿名
2025/04/18(金)
ID:NDE3NTA0M
llama-4-17B-FP8はローカルでも動かせるレベルの小さいやつじゃ
他の有料サービスとの比較に入ってるのおかしいような
と思ったら一応マルチモーダルなんだなこれ、ローカルでマルチモーダル動かせるのは期待大や
・個人への誹謗中傷
・特定の民族に対する差別的表現
・根拠なき在日、朝鮮人認定
・殺害を示唆するコメントなど
・NGワード回避
上記に該当するコメントはご遠慮ください
悪質な場合は書き込み禁止措置等が取られることもあります