硬核!B站up主一人历时100天开发出会写高考作文的AI
10月28日 消息:近日,B站up主图灵的猫发布了一则视频称,自己一人历时100天花费近500个小时,训练出了一个会写作文的人工智能Essaykiller,Essaykiller由17亿参数、2亿数据、1万行代码组成。
据介绍,Essaykiller是一个基于OCR、NLP领域模型所构建的生成式文本创作AI框架,目前第一版finetune模型针对高考作文(主要是议论文),可以有效生成符合人类认知的文章,多数文章经过测试可以达到正常高中生及格作文水平。
Essaykiller由4个神经网络组成,包括了:
第一部分的识别网络,通过外接摄像头的实时OCR以及卷积神经网络进行汉字的识别与提取。
第二部分语言网络分为两个子网络,一个网络负责读题能力,另一个负责写作能力。后者为整改AI的核心。
第三部分为判分网络,取出Essaykiller生成的多篇文章中,打分最高的一篇文章进行输出。
第一部分的识别网络,通过外接摄像头的实时OCR以及卷积神经网络进行汉字的识别与提取。
第二部分语言网络分为两个子网络,一个网络负责读题能力,另一个负责写作能力。后者为整改AI的核心。
第三部分为判分网络,取出Essaykiller生成的多篇文章中,打分最高的一篇文章进行输出。
图灵的猫称,搭建完上述架构后Essaykiller就算出生了,Essaykiller借鉴了Alpha Go的设计理念,只要0.1分钟就可生成多篇文章,可利用API调用单独的神经网络,对一百篇作文进行通顺度打分。
随后,图灵的猫对Essaykiller进行了大量的训练:阅读了大量的优质散文、议论文、历年高考满分作文等进行训练。Essaykiller共学习了360万张图像数据、2亿条中文预训练语料、上千篇微调文章。
但在训练的过程中却出现了小插曲。
图灵的猫称,由于自己的RTX2060S显卡经受不住这么大的网络规模以及计算量,导致内存“爆掉了”。据悉,Essaykiller的神经网络达到了17亿之多,已经超越了目前市面上可见的任何一个单GPU的运算内存限制。
在尝试了2080ti、谷歌TPU V3、Tesla V100之后,图灵的猫最后找到了RTX8000——目前世界上最大单卡显存的显卡,解决了这个问题。
最终!!Essaykiller在137个小时之后,学习完了全部的内容。
图灵的猫对两个地区的两个全国卷的作文进行了测试,并通过高考格式排版脚本利用改装后的外接装置对文本进行输出,宣布大功告成。
值得一提的是,目前该up主已经将这整个项目开源,并上传到了Github,同时还将训练好的Al迁移到了线上服务器,大家只要进入网页输入题目或者句子Essaykiller就会生成独一无二的文章。
感兴趣的用户可以>>>点此访问<<<
- 标签:车祸现场女尸图片
- 编辑:唐志钢
- 相关文章
-
科大讯飞回应讯飞输入法被下架:已完成整改 合规后重新上架
末世涅凰 http://www.xinzhiliao.com/sj/dongji/10813.html
-
反内卷?网传腾讯旗下工作室试点强制6点下班、周末双休
泷泽萝拉微博 http://www.xinzhiliao.com/sj/dongji/11982.html
- 乐视APP安卓版更新 新增“老板造车美利坚”字样
- 除讯飞输入法外 QQ和搜狗输入法被多家应用商店下架
- 交个朋友回应罗永浩再次被执行:已与对方达成和解
- 华为申请鸿鹍商标 此前曾申请朱雀、白虎等商标
- 滴滴递交赴美上市招股书 全球年活跃用户4.93亿