ChatGPT通过美放射学委员会考试但搜集信息的可靠性仍然堪忧

2023-05-18 06:32:09 来源：科技日报

(资料图)

加拿大科学家在16日出版的《放射学》杂志上刊登新论文称，最新版本的ChatGPT通过了美国放射学委员会的考试，突出了大型语言模型的潜力，但它也给出了一些错误答案，表明人们仍需对其提供的答案进行核查。

为评估ChatGPT在美国放射学委员会考试问题上的表现并探索其优势和局限性，多伦多大学研究人员首先测试了基于GPT-3.5的ChatGPT的表现。研究团队使用了150道选择题，这些选择题与加拿大皇家学院和美国放射学委员会考试的风格、内容和难度相当。这些问题不包括图像，分为低阶（知识回忆、基本理解）和高阶（应用、分析、综合）思维问题。高阶思维问题可进一步细分为影像学表现描述、临床管理、计算和分类、疾病关联。

研究人员发现，基于GPT-3.5的ChatGPT的正确率为69%，接近70%的及格线。该模型在低阶思维问题上表现相对较好，正确率为84%，但回答高级思维问题时表现不佳，正确率仅为60%。而性能更优异的GPT-4的正确率为81%，且在高阶思维问题上的正确率为81%，远好于GPT-3.5。但GPT-4在低阶思维问题上的正确率仅为80%，答错了12道题，而GPT-3.5全部答对了这些题目，这引发了研究团队对GPT-4收集信息的可靠性的担忧。

这两项研究都表明，ChatGPT会有提供不正确答案的倾向，如果仅仅依靠它获取信息，非常危险，因为人们可能意识不到其给出的答案是不准确的，这是它目前面临的最大的问题。（刘霞）

标签：

上一篇：环球新动态：5月17日基金净值：中银新回报灵活配置混合A最新净值1.643，跌0.06%

下一篇：最后一页

相关阅读

风雪高原战“疫”长卷寒潮下的西宁疫情防控观察

　　大风7级，大雪纷扬，最高气温只有-5℃！　　这是青海省西宁市开启全城全员首轮核酸检测的天气。　　...

时间：2021-11-09 14:35:00
拟音师：“雕刻”声音的人【三百六十行】

　　三百六十行　　拟音师：“雕刻”声音的人　　闭上眼，90后赵洪泽有时甚至可以通过走路的声音，来判...

时间：2021-11-09 14:34:55
“双减”之后中小学教师资格考试为何依然火爆

　　聚焦　　“双减”之后，中小学教师资格考试为何依然火爆　　近日，2021年下半年中小学教师资格考试(...

时间：2021-11-09 14:34:55
大数据助力贫困生成长

　　探索　　大数据助力贫困生成长大数据画像能为贫困生成长带来什么　　今年9月，云南省楚雄彝族自治州...

时间：2021-11-09 14:34:55
“大漠明珠”驶上发展快车道塔里木盆地做足生态大文章

　　塔里木盆地做足生态大文章　　“大漠明珠”驶上发展快车道　　从塔里木盆地的西北角到西南角，和田...

时间：2021-11-09 14:34:55
职校生可报考事业单位搬走职业教育的一块绊脚石

　　职校生可报考事业单位　　搬走职业教育的一块绊脚石　　“职业院校毕业生也可以报考事业单位了。”...

时间：2021-11-09 14:34:54
打算“双十一”买买买的姐妹看完这篇再“剁手”

　　打算“双十一”买买买的姐妹看完这篇再“剁手”　　女性对于保养的热衷超乎想象，不少人只要是听...

时间：2021-11-09 14:34:54
完美“飞天”仰仗全宇宙最酷飞船试驾员

　　完美“飞天”仰仗全宇宙最酷飞船试驾员　　11月7日，航天员翟志刚、航天员王亚平开展神舟十三号航天...

时间：2021-11-09 14:34:54
冠状病毒中损伤血管的蛋白首次确定

　　冠状病毒中损伤血管的蛋白首次确定　　国际战“疫”行动　　科技日报北京11月4日电 (记者刘霞)不少...

时间：2021-11-09 14:34:54
新电池结构让飞行汽车成为可能相关技术将亮相北京冬奥

　　新电池结构让飞行汽车成为可能　　相关技术将亮相北京冬奥会　　科技冬奥进行时　　搭载全气候电池...

时间：2021-11-09 14:34:53
H5N8病毒肆虐全球，我国家禽为何“独善其身”

　　H5N8病毒肆虐全球，我国家禽为何“独善其身”　　科技日报哈尔滨11月7日电 (记者李丽云)记者11月7...

时间：2021-11-09 14:34:53
重庆奉节一民警因公殉职年仅28岁

　　中新网重庆11月9日电 (记者刘相琳)记者9日从重庆市公安局获悉，重庆奉节县公安局民警袁华押解一...

时间：2021-11-09 14:35:32
哈尔滨市新增本土新冠肺炎确诊病例1例

　　中新网哈尔滨11月9日电 (记者刘锡菊)9日，哈尔滨市卫健委发布哈尔滨市11月8日0-24时疫情通报：11...

时间：2021-11-09 14:35:32
成都本地累计在管密接2757人、次密9097人

　　(抗击新冠肺炎)成都本地累计在管密接2757人、次密9097人　　中新网成都11月9日电 (记者贺劭清 ...

时间：2021-11-09 14:35:31
成都累计报告确诊病例23例出现1传13特殊案例

　　(抗击新冠肺炎)成都累计报告确诊病例23例出现1传13特殊案例　　中新社成都11月9日电 (记者贺劭...

时间：2021-11-09 14:35:31
呼和浩特一学校宿管员扇打学生致双耳鼓膜穿孔分管校长被免

　　中新网呼和浩特11月9日电 (记者张林虎)9日，针对“宿管员扇打学生致其双耳鼓膜穿孔”一事，呼和...

时间：2021-11-09 14:35:31
郑州通报8例确诊病例和无症状感染者活动轨迹

　　中新网11月9日电据郑州市委宣传部官方微信消息，11月8日0至24时，郑州市新增阳性感染者3例，均为...

时间：2021-11-09 14:35:31
新疆阿克苏果农：我们的生活像苹果一样甜

　　中新社新疆阿克苏11月9日电题：新疆阿克苏果农：我们的生活像苹果一样甜　　作者苟继鹏　　“我...

时间：2021-11-09 14:35:31
河北辛集开展大规模消毒消杀工作

　　今天(9日)上午，河北省辛集市召开疫情防控新闻发布会。会上，辛集市科学技术局局长辛彦卜介绍，新冠...

时间：2021-11-09 14:35:31
河北辛集新增本土确诊11例已转运定点医院诊治

　　今天(9日)上午，河北省辛集市召开疫情防控新闻发布会，辛集市副市长刘士民介绍，2021年11月8日0时至...

时间：2021-11-09 14:35:30
石家庄深泽县第五轮全员核酸检测结果全部为阴性

　　11月9日，石家庄市召开第12场新冠肺炎疫情防控工作新闻发布会。发布会上，石家庄市深泽县县长郝英鹏...

时间：2021-11-09 14:35:30
海口市1例治愈后的境外输入病例复阳已转至定点医院隔离医学观察

　　中新网海口11月8日电 (记者张茜翼)海口市新型冠状病毒感染肺炎疫情防控工作指挥部8日通报称，11...

时间：2021-11-09 14:34:59
四川新增本土确诊病例4例

　　中新网11月8日电据四川省卫健委网站消息，11月7日0-24时，四川新增新型冠状病毒肺炎确诊病例5例(...

时间：2021-11-09 14:34:59
黑龙江省新增新冠肺炎本土确诊病例6例

　　中新网哈尔滨11月8日电 (程岩记者史轶夫)黑龙江省卫健委8日发布消息，7日0-24时，黑龙江省黑河...

时间：2021-11-09 14:34:59
河南新增本土确诊病例18例其中郑州市16例周口市2例

　　中新网11月8日电据河南省卫健委官方微博消息，11月7日0—24时，河南省新增本土确诊病例18例(郑州...

时间：2021-11-09 14:34:59
河北新增确诊病例8例新增无症状感染者1例

　　中新网11月8日电据河北省卫健委网站消息，2021年11月7日0—24时，河北省新增新型冠状病毒肺炎确诊...

时间：2021-11-09 14:34:58
寒潮持续发威！南方气温纷纷触底强降雪中心转移至东北

　　中国天气网讯今天(11月8日)，寒潮继续南下，持续发威，南方大部最高气温将纷纷触底。强降雪中心将...

时间：2021-11-09 14:34:58
雪后寒！今日北京晴天回归北风劲吹最高气温5℃上下

　　中国天气网讯今天(11月8日)北京晴天回归，但在风寒效应下，“冷”仍然是天气的主题。气温方面，今...

时间：2021-11-09 14:34:58
黑龙江新增本土确诊病例6例均在黑河市爱辉区

　　中新网11月8日电据黑龙江省卫健委网站消息，2021年11月7日0-24时，黑龙江省新增新冠肺炎本土确诊...

时间：2021-11-09 14:34:58
寒潮继续影响华东华南等地东北地区等地有强降雪

　　中新网11月8日电据中央气象台网站消息，受寒潮影响，预计11月8日08时至9日08时，黄淮东部、江淮东...

时间：2021-11-09 14:34:58
辽宁新增本土确诊病例20例新增本土无症状感染者12例

　　中新网11月8日电据辽宁省卫健委网站消息，11月7日0时至24时，辽宁省新增20例本土新冠肺炎确诊病例...

时间：2021-11-09 14:34:58
寒潮影响“加码”：吉林力保电力供应停课停运范围加大

　　中新网长春11月9日电 (记者郭佳张瑶)连日来，一轮寒潮引发的强降雪席卷中国北方。位于东北地区...

时间：2021-11-09 14:35:34
常州连续一周无新增病例 10日全市各类学校将错峰复学

　　中新网常州11月9日电 (记者唐娟)11月9日，常州疫情防控指挥部学校防控组对外发布，自11月10起，...

时间：2021-11-09 14:35:33
哈尔滨机场开放恢复运行计划航班45架次

　　中新网哈尔滨11月9日电 (仇建记者史轶夫)9日12时22分，随着哈尔滨经阜阳飞往三亚的FU6685航班...

时间：2021-11-09 14:35:33
山西警方抓获6名“摸金校尉” 缴获“虎枕”等大量文物

　　中新网长治11月9日电 (记者李庭耀)记者9日从山西省长治市公安局上党分局获悉，上党警方侦破系列...

时间：2021-11-09 14:35:33
西藏基层第一书记话产业发展推进乡村振兴

　　中新网日喀则11月9日电(记者赵朗)近日，由西藏自治区网信办主办的第一书记话小康活动先后走进山南...

时间：2021-11-09 14:35:33
内蒙古通辽：强降雪致8个旗县区受灾

　　中新网通辽11月9日电 (记者张林虎)9日，记者从内蒙古自治区通辽市应急管理局获悉，自11月5日起，...

时间：2021-11-09 14:35:33
成都金堂：医护人取消婚礼坚守岗位手捧花被送到了战“疫”一线

　　中新网成都11月9日电 (邹立杨)连日来，华西医院金堂县第一人民医院实验医学科的主检验师易维佳都在...

时间：2021-11-09 14:35:33
江西铅山新一轮核酸检测结果均为阴性

　　(抗击新冠肺炎)江西铅山新一轮核酸检测结果均为阴性　　中新网南昌11月9日电 (记者吴鹏泉)江西省...

时间：2021-11-09 14:35:32
辽宁大连幼儿园和中小学学生即日起暂缓入校

　　中新网11月9日电据辽宁省大连市人民政府新闻办公室官方微博消息，大连市新冠肺炎疫情防控总指挥部...

时间：2021-11-09 14:35:32
2021年北京市重点碳排放单位：涉及多家印刷包装企业

3月15日，北京市生态环境局、北京市统计局发布了《关于公布2021年度北京市重点碳排放单位及一般报告单...

时间：2021-11-09 14:34:57
北京新增1例本土确诊病例

　　中新网11月8日电据北京卫健委官方微博消息，11月7日0时至24时，北京新增1例本土确诊病例，无新增...

时间：2021-11-09 14:34:57
河北石家庄深泽县7日新增1例无症状感染者为8岁男童

　　中新网11月8日电据石家庄卫健委官方微信消息，石家庄深泽县应对新冠肺炎疫情工作领导小组办公室8...

时间：2021-11-09 14:34:57
高速封闭、机场关闭、学校停课辽宁多部门发应急预案应对极端天气

　　中新网沈阳11月8日电 (李晛王景巍)7日在寒潮影响下，东北地区局地降大雪。辽宁省气象部门当日连...

时间：2021-11-09 14:34:57
云南新增本土确诊病例3例新增本土无症状感染者3例

　　中新网11月8日电据云南省卫健委网站消息，11月7日0—24时，云南省新增确诊病例9例，其中境外输入...

时间：2021-11-09 14:34:56
努力让每个人都有出彩机会

　　努力让每个人都有出彩机会　　“孩子明年要参加中考，成绩一直提不上去，送他读职高，也是一种选择...

时间：2021-11-09 14:34:56
参与和见证中国水电发展

　　参与和见证中国水电发展　　余吉安的童年是在马来西亚加里曼丹岛的沙捞越州古晋市度过的。家门口的...

时间：2021-11-09 14:34:56
中国航天：为实现中国梦提供战略支撑

　　中国航天：为实现中国梦提供战略支撑（科技名家笔谈）　　今年是中国共产党成立100周年，也是中国航...

时间：2021-11-09 14:34:56
8日起江西铅山县开展新一轮全员核酸检测

　　记者从江西省铅山县疫情防控指挥部了解到，按照疫情防控要求，为了充分保障公众的健康安全，现定于1...

时间：2021-11-09 14:34:56
适当“早教”可以，“早早教”大可不必

　　一家之言　　适当“早教”可以，“早早教”大可不必　　以前国庆节是放假了，可家家都有娃，放假补...

时间：2021-11-09 14:34:56

X 关闭

资讯中心纸业观察

“天问一号”环绕器进入遥感使命轨道将关注火星典型地貌和地质单元

2021-11-09
突破！中国国产ECMO进入临床阶段

2021-11-09
中国内地高风险地区增至6个大连疫情波及大学校园

2021-11-09
守好群众“看病钱”“救命钱” 新疆聘48名医保基金社会监督员

2021-11-09

“我在海底种珊瑚” 年轻潜水员和科研团队联手打造珊瑚“避难所”

2021-11-09
千县工程，把一般病解决在基层

2021-11-09
营造健康的爱美导向打掉制造容貌焦虑的医美广告

2021-11-09
创城经验化为抗疫力量

2021-11-09

X 关闭

ChatGPT通过美放射学委员会考试但搜集信息的可靠性仍然堪忧