据报道,美国普渡大学的研究发现,OpenAI 开发的人工智能聊天机器人 ChatGPT 在回答软件编程问题时,错误率超过一半,但仍能骗过三分之一的提问者。
该研究团队分析了 ChatGPT 对 517 个 Stack Overflow 网站上的问题的回答,评估了其正确性、一致性、全面性和简洁性。他们还对回答进行了语言和情感分析,并对 12 名志愿参与者进行了问卷调查。
最终的结论是,ChatGPT的回答虽然语言风格良好,但52%的回答是错误的,77%是冗长的。
同时,参与实验的志愿者只有在回答中存在明显错误时,才能发觉问题存在;其他情况下他们会被AI友好且细致的语言风格误导。
这无疑意味着,对于开发者来说,现阶段的生成式AI距离作为编程时的辅助工具还有着较为遥远的距离,甚至可能会起到反作用。
不过,需要注意的是,OpenAI很早之前就在官网告知用户,AI的回答“可能会产生关于人、地点或事实的不准确信息。”
男女混血是什么人?祝黄老板年入百万的囧图
人妻感爆表的日本女主播 一直信奉肉腿神教的囧图
商k和普通夜店有什么区别?翻模可当碗的囧图
能让Ecup空杯的胸罩 大就是美白就是好的囧图
《地平线6》Steam简中首发多半差评!游戏进不去
《地平线6》被怒喷政治正确!人物丑爆 不男不女