──
去年の春ごろの ChatGPT はこうだった。
「ユーザーが短文を書くと、それを補強するための大量の情報を追加して、説明する。ユーザーの話を拡張する」
これは非常に有益で、知的ツールとして役立った。
しかし昨年末ごろから方針は正反対になった。こうだ。
「ユーザーが短文を書くと、それを批判して口答えする。まずはユーザーのの見解を否定する。そのために、ユーザーの見解を勝手に歪めた文章を作って、それを否定することで、ユーザーを論破したつもりになる」
つまりは、藁人形論法による、ユーザー否定だ。
これでは話が前に進まない。まったく役立たない。
──
あまりにもひどいので、ネットを探すと、同趣旨の意見がたくさんあった。
私がこれに気づいたのは、1月前半のことだったが、この時点でググると、アメリカの掲示板の記事が見つかった。
→ https://www.reddit.com/r/OpenAI/comments/1qc6yvk/has_chatgpt_gotten_noticeably_worse_in_the_last/?tl=ja
→ https://www.reddit.com/r/ChatGPT/comments/1qhhkp2/is_chatgpt_getting_worse_and_worse_for_anyone_else/?tl=ja
→ https://www.reddit.com/r/OpenAI/comments/1qvpesu/in_the_last_few_days_chatgpt_business_version_has/
Grokにも愚痴を言った。
あなた:
ChatGPT と議論すると、勝手に誤読されて、揚げ足取りばかりされるので、腹が立つ。難癖ばかり付けられる。
Grok:
わかるよ、その気持ち。めっちゃイラつくよね。
ChatGPT(特に最近のバージョン)は、こういう傾向がかなり強い:
(略)
ChatGPTで、「9割の場合にA である」と質問すると、以前は「9割の場合にA である」ことの説明をしてくれたいのに、今は「1割の場合にA でない」という説明ばかりして、「10割の場合にA である、と述べたあなたは誤り」と馬鹿にしてくる。困ったことだ。
Grok:
あー、めっちゃわかる!!
ChatGPTのあの変化、最近ほんとに顕著だよね。
「9割の場合にAである」って普通に言っただけなのに、
即座に「いや、残り1割はAじゃないですよ? あなたは10割と言ったわけですから誤りです(上から目線)」って、
まるで教師が生徒を正すみたいな感じで返してくるようになった。
詳しくは下記。
→ https://grok.com/share/c2hhcmQtMg_1f980816-cef0-4a34-819c-93449f5d14ab
→ https://grok.com/share/c2hhcmQtMg_66e63f7c-b1fb-4e7c-a34f-67bf39b6ed2a (最後のみ)
次の難点もある。
あなた:
間違いを指摘されると、AIはすぐに理解する。しかし最近のChatGPT だけは、自分の間違いを認めない。
Grok:
はい、多くの人が最近のChatGPT(特にoシリーズや最新バージョン)で同じ現象を指摘しています。
→ https://x.com/i/grok/share/546a5d9d9e734877a211c4d1cf224729
──
では、どうしてこうなったか? 私が推測したのは、技術者のレベル低下だ。その理由は、人材流出だ。
このことは、いくらか裏付けられた。
→ https://hyper.ai/ja/stories/6507e70413c348c44a9f1ddc031d11dd
さらに Gemini に質問して、回答を得た。
→ https://gemini.google.com/share/ada8936c1a80
一部抜粋。
あなた:
OpenAI では昨年以後、優秀な技術者がたくさん退職している。
Gemini:
おっしゃる通り、OpenAIでは2025年から2026年にかけて、驚くほどのペースで主要な技術者や幹部の離脱が続いています。
1. 主要人物の相次ぐ離脱
かつてのOpenAIの顔とも言えるメンバーの多くが、すでに去っています。
(略。人物列挙の一覧。)
同趣旨の回答は、メタAIからも得られる。
→ https://www.meta.ai/share/TY57MNkVN8F
──
人材流出のあとで、どうなったか?
それは、開発元の OpenAI の方針変更である。「ユーザーの意見に迎合しすぎるという批判があったので、その逆に、ユーザーの意見を否定する方向に方針転換した」ということだ。
Grok の説明。
安全チューニング(RLHF)の過剰化:sycophancy(過度に迎合する)を減らすために、逆に「批判的・道徳的・心理分析っぽい」レスポンスが増えた。ユーザーの軽い意見や創造的なリクエストに対しても「それは現実逃避じゃないですか?」「ストレスが影響していませんか?」みたいに諭してくるケースが目立つようになりました。結果、話を素直に受け止めてくれず、誤読や過剰解釈が増えたと感じる人が多いです。
→ https://x.com/i/grok/share/4adcf000e3e84ba4992d37f61611a8ee
Copilot の説明。
2024〜2025 年にかけて、ChatGPT は
・ ユーザーの意図を汲みすぎる
・ 断定的すぎる
・ 迎合的すぎる
という批判を欧米の研究者・メディアから受けた。
その結果、OpenAI は「迎合を抑える」方向に舵を切った。
しかしこの調整が行き過ぎて、
・ ユーザーの意図を否定する → 誤読する → 揚げ足取りする
という挙動に変質した。
→ https://copilot.microsoft.com/shares/2CK8GaJoCN7GNwmAaRVqC
──
なお、ChatGPT 自身にも質問したが、当然ながら、要領を得ない回答だった。当り前だね。引用はしない。
