发布日期:2024-10-07 14:05 点击次数:108
这门北大数学课twitter 反差,学生和考验尽然齐在用AI“摸鱼”?!
不仅如斯,考验如故主动推选你用,“便捷跟上讲课程度”。
底本,这是一位北大数学考验故意构念念并落地的AI助教,不仅能当学生的课后助理,还能当考验的贴心文书。
对学生来说,学校的冗长教案看不懂,径直扔给AI助教,立时就能划好重心,真·喂饭喂到嘴边。
而对考验来说,一拖、一拉、一拽,3步就能把我方的课程教案丢给AI助教,省去了对着东说念主类助教大费长短的时辰。
因为使用丝滑,这个AI助教被北大数院21级本科生刘梓豪起名为Brainiac Buddy,意为“阿谁颖悟又劳作的家伙”(doge)。
不卖关子了,这门课叫《图像管理中的数学设施》,开课考验是北京大学北京国外数学研究中心长聘考验、北京大学国外机器学习研究中心副主任、北京大学国度生物医学成像科学中心研究员、大数据分析与应用技巧国度工程实验室机器学习中心成员、北京大学长沙狡计与数字经济研究院副院长董彬。
统共这个词Brainiac Buddy,由董彬团队和校外公司Answer.Ai团队聚首打造。
在与量子位的疏通经由中,董彬示意:
OpenAI独创成员Andrej Karpathy之前讲昔日是Agent Base,我深以为然。
是以想在AI助教上试试,能不可完了个性化、定制化和互动式,以此提高素质质料。
基于不同prompt“一键变身”
Brainiac Buddy(以下简称BB),基于GPT-4开荒。
团队针对数学课程进行了重心优化,率先拿来试手的等于《图像管理中的数学设施》这门课。
简而言之,通过学习和分析课程大纲、参考书、课本和代码示例,BB不仅专科常识拔尖,“大脑”也一经是数学考验的形势了。
亲自上手体验一下~
登陆后,以《机器学习》第一章弁言章为例,不错看到如下的界面:
BB界面共有三个分栏:
最左侧,是对于本章节课件的演示文档(接济多种面容),章节关系的附件及挂载的常识库;中间栏呈现了课件文献的渲染,提供在线浏览功能;最右侧则是与BB的对话界面,不错与课件、常识库进行问题的研究以匡助学习了解课程内容。
在右侧分栏径直发问,不错从embedding教案后的课程常识库中检索出该问题的解答。
大众皆知,大模子具有通用常识,但针对具体的鸿沟可能不是很精确。
于是基于大模子的基座模子,刻下BB是基于GPT-4,把课程存储到向量数据库中,便捷学生在学习常识的经由中,得到大模子的接济,匡助他们剖释常识难点,使不同基础的学生齐不错得到顺应我方的解读模式。
不外董彬也谈到,手脚研究者,其实是比较可爱大模子幻觉(hallucination)的,“因为幻觉和创造/改动其实只消一线之隔。”
通过不同的prompt,BB概况调用不同的具体处事。
BB提供给教师最大的纯真度,让他们概况充分利用大模子优点的同期,赐与最大程度的自界说prompt,让课程的交互性和交互经由按照不同的课程,呈现不同的成果。
比如调用测试模式:
又或者转头文献主要内容:
举座感受,BB莫得什么花里胡梢的UI界面,使用起来和一般的AI Chatbot比较肖似。
“AI Agent=大模子+顾忌+主动筹备+用具使用,基本上呈现出的等于目下专家看到的这个面容。” 董彬说说念。
至于后续对BB还有什么完善(的想法),他示意,但愿能让BB能围绕一个数据库来准确索取信息,并左证问题判断,到底应该用数据库信息往还话问题,应该调用表里部用具,如故调用通用才智回话问题。
AI 辅助数学学习
目下AI用具这样多,为什么要故意作念这样一个AI助教?
其中天然有履行的制肘。
最基础的,就算只把《图像管理中的数学设施》这门课的教案丢给GPT,也一经超出了GPT系列的token终端。
但更多起头于董彬本东说念主的贯通和践诺。这亦然他寻求与校外公司Answer.AI勾通,作念出BB,并本色垄断到课程中的主要原因。
董彬天然是数学专科竖立,但2016年起转向机器学习,目下的主要研究鸿沟为科学狡计、机器学习偏激在狡计成像和数据分析中的应用。
他自称从大模子大显威力的第一天起,等于其诚笃奴隶者,根底莫得国表里那些大学“先禁用再应用”的心态袭击。
尤其是GPT-4问世后,董彬成为了大模子高频率的重度依赖用户,“它很大的作用,不是帮我干杂事,而是我通过它来学东西”。
董彬的切肉体验是,只消问题问得好,回话的质料就会相配高。不管何时何地,只消有突发奇想,就不错跟鸿沟内最博学的“东说念主”疏通,何况从不以为他提倡的问题蠢。
有了这样的体验,董彬脑子里冒出一个念头:
不行,要给我的学生也配备这样一个用具。
“学习等于跟作家疏通,听作家讲课,接收常识的形势是相配被迫的。” 董彬解说,“听课或看书的经由中,会产生各式各类的疑问和想法。但考验的贯通、元气心灵、耐烦齐是有限的。”在他看来,要是无法跟作家交互,学习就会变得相配低效,额外是还无法1v1答疑解惑的情况下。
但AI 助教,或者说大模子,就遍读全东说念主类常识,且元气心灵和耐烦历久充沛,概况“极大程度上提高造就的遵循,以及个性化和定制化。”
有了我方的想法,刚巧教过的两位学生——数学学院21级本科生刘梓豪和20级本科生唐艺铭,想侍从董彬作念一些暑期技俩。
于是,BB被提上日程。
这时候董彬了解到了Answer.AI。这家创业公司旨在利用智能助教(AI Tutor)让宽阔学生享有到最优质的造就资源和最佳的学习体验。他们的造就居品发布后,在很短时辰内取得好意思区iOS造就榜单第三名的收货。
刚巧,他们也但愿与各个学校和机构一说念探索全新的素质模式,并提供进修的居品和技巧有筹备。
和Answer.AI战斗后,董彬带着刘梓豪和唐艺铭与其工程师团队疏通了我方的想法,两边一拍即合。
此后,Answer.AI 为BB提供了居品化有筹备。何况在工程师的匡助下,最终完成了BB的概念、遐想、数据管理、天然谈话编程、UI制作等。
后续可能作念“学会发问”主题在线共享
临了,崇拜先容一下这位和蔼邀请学生在课程中使用AI助教的数学考验。
董彬,北京大学北京国外数学研究中心长聘考验、北京大学国外机器学习研究中心副主任、北京大学国度生物医学成像科学中心研究员、大数据分析与应用技巧国度工程实验室机器学习中心成员、北京大学长沙狡计与数字经济研究院副院长。
2003年,他在北京大学数学科学学院拿放学士学位,两年后,在新加坡国立大学数学系取得硕士学位。
其后,董彬又远赴UCLA数学系,并于2009年取得博士学位。
他示意,但愿更多的同寅同侪参与使用BB,概况从中得到更多响应和启发。
左证目下得到的一些响应来看,最令董彬“无语疾首”的,等于学生在对AI发问才智上的欠缺——既不爱发问题,也不擅长发问(prompt)。
大批来讲,学生老是爱径直把问题自己丢给AI。
这自己没什么问题,但还够不上一本万利的成果。
在量子位的追问下,董彬共享了我方常用的发问模式。在他每一次针对具体问题的发问中,频频含有好几步经由:
激情率先,先告诉AI这个问题的布景,比如我方是在作念什么的时候、看到什么东西、如何产生了这个问题;
其次告诉AI,这个问题的难点在哪?可能和哪些已知问题关系,也会谈一下为什么我方以为这是个好的问题;
然后会谈谈我方对问题的初步念念考,以及对我方现存想法不知足的场地,并在期待什么样的更好的想法。
临了再问AI,能不可襄理提供一些建议。
比拟于径直把问题自己丢给AI,然后赓续追问,这样的模式可能两三轮就能很好地解答一个问题。
董彬举了个近期的例子。
最近,他和基础数学家何旭华在arXiv上挂了一篇用机器学习辅助数学前沿探索的论文。第二天,何旭华的一位勾通者看到论文,发来一封邮件,发轫是“et tu Brutus”。
董彬此前从未见过这个表述,于是去问了Claude。
对比可见,只消好意思满告诉Claude布景信息,它的解读才会正确,还给东说念主一种“情商很高”的嗅觉。
手脚AI重度用户,董彬在平方和作念敷陈时发现,好的发问和不好的发问,得到的谜底相反其实有彰着相反。
往后会筹商开设课程或进行在线共享,让学生学会如何发问。
通过BB,董彬使用prompt的训诫和设施论也不错更便捷的千里淀给学生,通过教师功能,不错便捷的为每个章节开荒独到的prompt。
据了解,后续BB会为学生提供prompt预设功能,并针对学生提供快捷输入prompt的功能,以提高使用体验。
以及现阶段,董彬刚在arXiv上挂出了一篇论文《Prompt Engineering Through the Lens of Optimal Control》,臆测从最优戒指视角解读交互工程,感酷好的小伙伴不错阅读一下~
转载本网著作请注明出处twitter 反差