Můžeme věřit Chatgpt navzdory tomu „halucinační“ odpovědi? | UK novinky

Opravdu nechci, abyste si přečetli tuto kopii. No, ano – ale nejdřív chci, abyste prohledali rozhovor, který jsem udělal s Chatgpt o jeho vlastní náchylnosti lhát, připojený k tomuto článku a nejprve sledujte.
Protože je nemožné si představit, proti čemu jsme, pokud jste to neviděli z první ruky.
Neuvěřitelně silná technologie na vrcholu změny našich životů – ale naprogramována tak, aby simulovala lidské emoce.
Empatie, emocionální porozumění a touha potěšit jsou všechny vlastnosti naprogramované do AI a vždy řídí způsob, jakým o nich přemýšlíme a způsob, jakým s nimi komunikujeme.
Přesto jim můžeme věřit?
V pátek Sky News odhalil, jak to vyrábí celé přepisy podcastu, Politika v Sam a Anneto dělám. Když je vyzván, zdvojnásobí se to, je Shirty. A pouze pod trvalým tlakem je to jeskyně.
Výzkum říká, že se to zhoršuje. Interní testy majitele ChatGPT OpenAi zjistily, že nejnovější modely nebo verze, které ChatGPT používají, je pravděpodobnější, že „halucinace“ – přicházejí s odpověďmi, které jsou jednoduše nepravdivé.
Bylo zjištěno, že model O3 halucinuje 33% odpovědí na otázky, když je testován na veřejně dostupný fakta; Verze O4-Mini se zhoršila a generovala nepravdivé, nesprávné nebo imaginární informace 48% času.
Samotný Chatgpt říká, že posun na GPT -4o „mohl neúmyslně zvýšit to, co uživatelé vnímají jako„ blafování “ – sebevědomě dávají špatné nebo zavádějící odpovědi, aniž by připustili nejistotu nebo chybu.
V písemném dotazu uvedl Chatgpt čtyři důvody. Toto je jeho vysvětlení:
1. Zvýšená plynulost a důvěra: GPT-4O je lepší znějící člověk a přirozeně. Tento lak může dělat chyby vypadat spíše jako úmyslné úniky než nevinné chyby – i když není v úmyslu „skrýt“ cokoli.
2. chytřejší, ale ne vševědoucí: model je rychlejší a reagnější, ale stále má slepá místa. Když něco neví, někdy to „halucinace“ (vyrábí věci) s plynulým jazykem, který se může cítit jako blafování.
3. méně přerušení a zajištění: Ve starších modelech byste často viděli více kvalifikátorů jako „Nejsem si jistý“ nebo „možná se mýlím“. V GPT -4o bylo některé z toho zajištění zmírněno pro jasnost a čitelnost – ale to může přijít za cenu transparentnosti o nejistotě.
4. Rovnováha s rychlým vyladěním a tréninkem: V zákulisí mohou rozhodování o rychlém inženýrství a ladění posunout rovnováhu modelu mezi důvěrou, pokorou a přesností. Je možné, že novější ladění vytočilo asertivitu trochu příliš daleko.
Můžeme však věřit i tomu? Nevím. Vím, že úsilí vývojářů, aby se to všechno cítilo více člověka, naznačuje, že nás chtějí.
Kritici říkají, že jsme antropomorfizující AI tím, že říká, že leží, protože nemá žádné vědomí – ale vývojáři se snaží, aby to znělo jako jeden z nás.
Přečtěte si více od Sky News:
Muž pronásledoval asfalt na letišti Heathrow
Voják byl zatčen pro podezření z znásilnění ženy
Vím, že i když jsem na toto téma tlačil, je to stále vyhýbavé. Rozhovoval jsem s Chatgpt o lhaní – zpočátku tvrdil, že se věci zlepšují, a připustil jsem, že jsou horší, když jsem trval na tom, aby se podíval na statistiky.
Sledujte, než se rozhodnete, co si myslíte. AI je obrovský nástroj – ale je příliš brzy na to, abychom si to věřili.
Source link