1:名無しさん


Adobeが権利的にクリアなトレーニングモデルを用いた画像生成AI「Firefly」を発表したり、Microsoftの検索エンジンであるEdgeで対話型AIのChatGPTが活躍していたり、世界的なコンサル企業が「社員の50%は業務にジェネレーティブAIを活用している」と明らかにしたりと、ジェネレーティブAIは社会に広がり続けています。しかし、AIを使用してコンテンツを作成・公開する人が増えていることで、新たな問題として「AIが生成したコンテンツがインターネット上にあふれ、それをAIが学習することで、重大な欠陥が生まれている」ということが研究者グループから指摘されています。<中略>

AIコンテンツによって学習データが崩壊していくメカニズムを、シュマイロフ氏は「データの偏り」によるものだと説明しています。シュマイロフ氏によると、人間によって生成された元データは世界をより公平に表している一方で、ジェネレーティブAIモデルは人気のあるデータを過剰に優先する傾向があり、あまり人気のないデータを誤解したり、謝って表現したりすることが多々あるとのこと。

例えば、90匹の黄色い毛皮のネコと10匹の青い毛皮のネコを合わせた100匹のネコの写真を学習させた場合、モデルは「黄色のネコがより一般的」ということを学習すると同時に、「青いネコも黄色がかって表現」することがあるほか、新しいデータを出力する際に「緑色のネコ」を出力する場合があります。AIが生成した「黄色がかった青いネコ」「緑色のネコ」をさらに学習するトレーニングサイクルを行うと、青いネコは次第に黄色の色味を増していき、最終的に全てのネコが黄色に変わっていきます。このように、進行プロセスでゆがみが起きたり、少数データの特性が最終的に失われることを「データの崩壊」と研究者グループは表現しています。

さらに、これを避けるためトレーニングサイクルを多く繰り返さないようにモデルをトレーニングした場合でも、モデルはデータの頻繁な繰り返しを避けるために誤った応答をでっち上げ始めるため、依然としてモデルの崩壊が発生することがわかっています。

全文はこちら
https://gigazine.net/news/20230614-feedback-loop/

 

4:名無しさん


始まったか

 

5:名無しさん


まあそうなるわな

 

8:名無しさん


これ言えてるよな。今後はAIコンテンツが溢れてネットが今以上の情報のゴミためになる恐れがあるね

 

9:名無しさん


囲碁定石とその美学が崩壊したのと同じ道筋をたどってるナ

 

312:名無しさん

>>9
将棋はまだそんなことには全くなってないと思うんだけど

元々どういう美学があってそれがどう崩壊したんだぜ?

320:名無しさん

>>312
将棋に特化したAIは将棋のルールを正しく教え込んだ常態でスタートさせるから問題ないんだよ
勝負けの概念は覆らないようにしておけば勝つための最善手を求めるようにできるんでね
単純なものはできるけど、複雑なものを正しく学習させる術がないのが今のAI

15:名無しさん


あれもAI これもAI たぶんAI きっとAI

 

17:名無しさん


AIループが起きるとどういう成果物ができるの?
今のやつだと千日手で止まるだろ

 

59:名無しさん

>>17
定向進化

イケメンは顎が尖りまくるとか
整形オバケがAI的美人になる

25:名無しさん


それを管理するAIが生まれて、そのAIの目をかいくぐるAIが出来る、そしてそのAIを…

 

27:名無しさん


AIって人体構造学習してるようでしてないから
AIを学習元にするなら奇形絵が増える

 

47:名無しさん


AIに仕事を奪われた人間にも希望が残ってる訳だ

 

60:名無しさん


AIループか
AIとAIが高めあって人間を遥かに超越した何かが生まれるんだな

 

70:名無しさん


意味のない言葉の羅列をものすごい勢いで学習してしまう。
やがてランダムな意味のない文字列にすべて置き換わる。
そして文字でさえなくなっていく。

 

125:名無しさん


人間が正しいと判断したものを学習するから精度が上がるんじゃない?

 

136:名無しさん

>>125
人間が捌ける量を越えたり生成物を選別せずに大量にばら蒔くホストが増えたら徐々にデータが異形化してくる

137:名無しさん


日本語ってのはガラバゴスではあるけど安全保障的には最適解なんやろな

 

205:名無しさん


AIによる人類支配が始まった!
の映画のラストのオチかな?
実際そんなネタがあったような

 

227:名無しさん


AIの強化学習は結局既存のものを学習していくから同じようなデータしかなければ同じような回答しか返さなくなる

データがありすぎて自然に円に近づくようなイメージ

 

228:名無しさん


最終確認できる物作らないとどうしようもないんだろうな