讲睡前故事的,未必是亲妈......(讲睡前故事的电台)

期待 AI 创作儿童绘本的点子由来已久,但一直难觅成功的案例——那种孩子喜欢并接受,父母信任又安心的。

去年,Google I/O 期间推出了一个比较小众的实验性项目(Infinite Wonderland)。

Google 跟几位艺术家合作,将图片生成模型(当时是 Imagen 2)训练成各自独特的风格。成果以一本《爱丽丝漫游奇境记》在线绘本呈现。

当你随机点击书中的一段文字,这段文字则会作为提示词实时生成一张配图。为了看起来不像“预制菜”,开发者在生成过程中加入了随机种子(Seed),这样即便反复点击同一段文本,生成的也是为同一段内容搭配的不同图片。

Infinite Wonderland

这个项目在创意性和艺术性上都很有特色,但当时,他们只做了爱丽丝那一个故事。

也算是没让人等待太久。最近,我发现 Gemini 上新了一个 AI 故事书的新模块“Storybook”,(https://gemini.google/overview/storybook/)

比 Infinite Wonderland 厉害的是,Storybook 不仅能“绘”,还能“讲”,它根据你输入的灵感,讲出来一个完整的故事。加上还有朗读功能,语速适中,发音标准。

这不但能解救睡前被缠住讲故事的父母,甚至还能当作完美的英语启蒙教学。

轮到 AI 讲睡前故事了

我请教了几位有孩子的家长朋友,并总结了他们挑选儿童绘本的大致逻辑:图像和文本质量要过关;分“年龄段”;故事有逻辑,线索丰富最好。我们一起看看 Storybook 能不能满足这些需求?

prompt:For two-year-old; caterpillar’s adventure story; picture book。看到 AI 给我的绘本之后,我倍感羞愧。相比之下,人类会敷衍多了。

右滑查看完整绘本

它讲述了一个毛毛虫不断长大、啃食,进入蛹期形成茧,再破茧成蝶的故事。

首先,AI 生成的插画质量不错,清晰度高,色彩丰富,甚至将毛毛虫长大的面部神情展现了出来。总的来说,是一个情节简单、欢快的科普小故事。

接着我让它生成“一本适合五岁小孩的侦探故事,背景发生在图书馆,插图《玩具总动员》风格。”

右滑查看完整绘本

角色有穿『风衣』的熊侦探、戴眼镜👓很显睿智的猫头鹰教授、骑士、偷了故事书的公主玩偶。但是公主在几张图上都不一样,说明角色一致性还有待提高。

先不说插图风格,玩具在晚上活过来还挺“玩总”的。

然而我不太理解一个情节,就是保护童话书的骑士为熊侦探提供线索(后来我反应过来,既然熊能当侦探,为什么骑士不能去图书馆值夜班保安,果然大人的想象力还是太局限。)

你可以直接在 Gemini 的对话框里输入希望对绘本进行的调整。比如我当时要求调整一下“骑士”角色,换一个找寻失窃图书的线索。

然后 Gemini 将骑士换成了一个在懒人沙发上睡觉的熊,说得几乎同样的台词。只能说,Gemini 理解了我的需求,但没有执行得很好。

右滑查看完整绘本

父母希望小孩在成长过程中逐渐理解“友情”、“勇气”等“抽象概念”,但是有时候苦于找不到一个合适的机会。如果这些从一本小孩经常阅读的绘本中演绎出来,会是一个很好的教育方式。

比如你跟 Gemini 说,“我7岁的孩子不愿意在奶奶家过夜,创作一个故事让他们打开心结。”

右滑查看完整绘本

Storybook 很有想象力的一点是,还支持上传文件。比如孩子刚画了一张画,满心期待地给你看,你除了夸夸,还可以让 AI 基于这张画生成一个故事(母慈子孝这不就来了)。

首图来自小红书网友,右滑查看基于这张图片生成的完整绘本

或者孩子总是缠着你,让你解释啥是黑洞、人工智能能做什么、你做啥工作的?为什么总是那么忙……你都不必再用一句,“你还小,现在还理解不了,长大了自会知道”敷衍了事。

如果小孩已经认得了全部的单词,你可以要求 AI 重新遣词造句,逐步提升阅读难度。建议后面加上“点读”功能就更好了。

目前该功能支持中文、英文、意大利语等在内的45种语言。建议你用来生成架空的故事,比如有一次我尝试让它做一本“荆轲刺秦王”绘本,不出意外的,AI 又胡说八道了。

但会讲故事的 AI

也无法代替父母的陪伴

随着我和 Gemini 聊得越来越投入,它告诉我,Storybook 这个功能始于一位开发者(还是个奶爸)使用 Gemini API 参加 Google AI Developer Challenge 的一个项目。

背后大概的技术链条是,利用 Gemini 创作一个10页的故事——Gemini 再为每一页故事创建图片提示,发送给 Imagen——再由模型微调技术保证画面风格迁移和人物角色的一致性,类似基于 Stable Diffusion 做的 LoRA 和 Dreambooth,你可以将它理解成生图模型上打的一个“补丁”。

就在最近,Google 推出了Gemini 2.5 Flash Image。目前不清楚 Storybook 是不是更新到这个最新的图片生成模型,但可以看出角色一致性、完全基于提示的图像生成和编辑一直是图像模型追求的能力提升,也是图像模型产生实用价值的关键。

prompt:Using a Claymation art style, create a storybook about friendly bees and how useful they really are to the earth, to help my kids lose their fear of them.右滑查看完整故事书

第一次调整,用自然语言跟 Gemimi 对话,让它将黏土风格换成水彩,右滑查看完整故事书

第二次调整,让 Gemini 将男孩换成一个名叫 Alice 的女孩,并将水彩风格换成漫画风,右滑查看完成故事书

应该是为了保证一致性效果最佳,Storybook 目前至多生成十页绘本,限制了它没法展现复杂逻辑或宏大主题的故事,总是看得我意犹未尽的。

不好的反馈声有两种,一是,担心小孩过早接收到 AI 的“陈词滥调”、担心生成的内容没有经过人工检验,不适合阅读;

二是,这样 AI 将进一步淹没出版、作家、插画师等行业的努力——目前有第三方做了一个在线绘本库,上面已经上传了三百多个经挑选过的用 Storybook 生成的绘本,并根据年龄段、情绪基调、语言、类型、故事背景做了区分(https://geministorybook.gallery/)。

网站截图

从网站截图的一本,右滑查看完整故事书

不过我想说,甄别不出上述问题的家长,或许此前也不会花多少心思挑选绘本。

技术中立太老生常谈了。Storybook 可以作为低龄儿童的辅助阅读材料,如果你用承担认字和阅读分级教育作用的正规出版图书作为标尺,那么 AI 绘本显然不够如此严谨。

能让小孩时常回味一些和家庭、朋友之间的美好瞬间,父母为孩子讲解就在当下他所感兴趣,或困扰着他的话题,也许是比起传统绘本,AI 绘本更有价值的地方。

作者:TY

编辑:沈知涵

特别声明:[讲睡前故事的,未必是亲妈......(讲睡前故事的电台)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

『王楚然』生日写真梦幻出圈,满头蝴蝶结🎀演绎童话公主(『王楚然』生日写真图片)

无论是从发丝到指尖的每一处细节,都经过了精心设计,造型既具有强烈的视觉冲击力,又凭借极致的细节呼应,展现了她如糖般的甜美却不腻人,网友们纷纷称这组照片为甜而不腻的典范,这一切也让她瞬间登上了热搜榜首。 这…

『王楚然』生日写真梦幻出圈,满头蝴蝶结🎀演绎童话公主(『王楚然』生日写真图片)

华友皮革|世界皮革地理志(华友针织有限公司(新厂)怎么样)

Gucci、Prada等品牌扎根于此,将皮革的柔软特质与经典设计融合,让每一双牛津鞋、乐福鞋都成为时光里的优雅注脚。 从意大利的奢华匠心到西班牙的柔韧多元,再到中国的创新活力,每片产区的皮革鞋履都承载着当地的…

华友皮革|世界皮革地理志(华友针织有限公司(新厂)怎么样)

『肖战』、肉丝、果断女、千玺、『赵丽颖』、『白鹿』、『李昀锐』、『鹿晗』、『杨幂』、『刘宇宁』、卢昱晓(『肖战』巨肉)

邋遢小花对动物男星情有独钟,知道男星分手后托人要到了对方的联系方式,想要上位当新嫂子。9.『赵露思』在新剧里的一部分妆造没那么适配场景,不过她粉丝是听不得这样的言论的,对于这类评论区留言通常都是劝删的。 10.…

『肖战』、肉丝、果断女、千玺、『赵丽颖』、『白鹿』、『李昀锐』、『鹿晗』、『杨幂』、『刘宇宁』、卢昱晓(『肖战』巨肉)

邓婕探望95岁王扶林,6字问候看哭网友,38年红楼情从未褪色(邓婕上镜)

回望1984年,《红楼梦》剧组在全国范围内挑选演员,而王熙凤这一关键角色的选角更是备受瞩目。 回想起当年拍摄《红楼梦》时,剧组特地组织演员集中培训三年,邀请了沈从文、启功、周汝昌等数十位名家为演员讲…

邓婕探望95岁王扶林,6字问候看哭网友,38年红楼情从未褪色(邓婕上镜)

忍辱负重36年,被骂吃软饭的迟重瑞,完成了一场教科书级的复仇(忍辱负重5年)

这种感觉让人不禁想,73岁的他,似乎虽然老了,但又不至于显得太老,这在同龄人中实属不易。 如今的迟重瑞虽然在物质上得到了荣华富贵,但他的婚姻和晚年生活,却让人不禁心生复杂的情绪。可是,迟重瑞依然能够忍受这…

忍辱负重36年,被骂吃软饭的迟重瑞,完成了一场教科书级的复仇(忍辱负重5年)