人工智能作为新质生产力的重要代表,在Web3.0时代,以其卓越的生成能力为各行各业极大地提高了生产效率。具体到出版行业来讲,生成式人工智能在选题策划、内容生成、编辑校对、市场营销等出版全流程均可提供极大的帮助。
《穿越红楼:红学课花式作业集》,苗怀明主编,华文出版社2025年6月版。
利用人工智能技术自动生成各种类型的内容(AIGC),包括文本、图像、音频、视频等多种形式,随着技术的发展,已经由初期的数据堆砌重构发展为创意性、情感力兼具,并可以充分兼顾科技伦理的高效优质内容。
中国出版集团旗下的各家出版单位,拥有一大批优质的经典IP内容资源。中国出版集团有限公司董事长黄志坚认为:“立足自身出版优势,以实现内容数据化为核心竞争力。”[1]
近些年来,纸质图书市场呈现下滑趋势,越来越多的出版人希望通过科技手段找到更年轻读者的关注点和兴趣点,让经典IP、中华优秀传统文化通过科技的加持,以年轻读者更耳熟能详的话语方式重构,让AI与内容产出深度融合。
2024年,笔者任职的华文出版社就经典IP《红楼梦》做了一次AI深度参与的尝试。由南京大学网红教授苗怀明先生主编的《穿越红楼:红学课花式作业集》(以下简称《穿越红楼》)融合了Web1.0至Web3.0的三种创作方式,在AI的图像生成训练及续写型文本训练上做了行之有效的探索。
1959年,艾伦·图灵发表了题为《计算机器与智能》的论文。这篇论文在当时的知识界与科技界仿佛重磅炸弹,文中对机器能否思考发问,提出一种模仿游戏,让思想与思维成为实验的主体,进而赋予机器智能化以可行性的操作方式,即“图灵测试”。
尽管这一测试充满了缺陷和不完善,但第一次为具备智能的机器画像,让人工智能具有了模糊但可追寻的雏形。
人工智能三要素为算法、算力与数据。算法,是人工智能的思维方式;算力,是人工智能思维速度的关键;数据,是人工智能最基础的底层支持,也奠定了AIGC的气质底色。在AI发展早期,算法相对简单,运用领域的专业性相对较强,AI开发者们更多将关注点放在数据积累上。
2016年,伦敦科幻电影节上,名叫本杰明的AI机器人撰写剧本的9分钟电影《阳春》,成为电影节的的关注焦点。这是算法相对简单,更倡导数据训练时代的AI文本生成结果,可以在9分钟的影片中看到《第五元素》等多部科幻电影训练学习的痕迹。[2]
2017年,微软通过人工智能机器人“小冰”,书写了人类历史上第一部由AI创作的诗集《阳光失了玻璃窗》。
这本AI诗集由北京联合出版社出版,由计算机视觉和图形学研究的世界专家沈向洋作序。“小冰”先学习了1920年以来中国现当代519位诗人的作品,在此数据支持下,根据模拟人类诗歌情感表达与意象选取的算法逻辑创作。
尽管这部作品包括了“用一天经历一世的欢喜”这样情感细腻的佳句,但由于“小冰”的创意性和逻辑性相比人类有巨大差距,整本诗集更像是偶得佳句的拼凑。
江小涓等学者在《数据、数据关系与数字时代的创新范式》一文中认为:“物质世界的诸多奥秘都可以从数据之间关系的维度来理解。算法的本质就是在寻找数据之间的关系,深度学习就是学习如何发现数据间存在的各种关联。”[3]
在笔者看来,唯有且只有从数据出发的人工智能研发,才具有成功潜质。这也是在用户创作时代尾声,人工智能迎来爆发式突破的原因。
用户创作让信息生产门槛降低,海量信息涌入互联网,数据呈现几何级数增长,数据库是这一时代互联网发展与资本格外关注的领域。
早期人工智能时代,投资量级低、多靠开发者智力劳动的算法是中小型科技公司更多关注的领域,但由于数据来源单一,这种依托纯代码而完成的算法,在实际操作中会出现代码冲突、安全漏洞、算法缺陷等情况;反复叠加的程序补丁,又对硬件算力提出了更高的要求,很难获得突飞猛进的发展。
科技伦理在这一时期突出体现在信息伦理上,对用户隐私的保护与用户喜好抓取、数据精准推送成为天然的二元对立话题。因此,早期人工智能在数据积累上的成就是非常明显的,在算法精进上则稍逊一筹,对于科技伦理的关注处在初期探索阶段。
在相当长的时间中,出版行业一直以劳动力密集型产业呈现于世。自选题策划开始,至图书送达读者手中,每本书平均需要12个人参与。文稿环节的三审、三校,生产环节的设计、排版,印制环节的质检、印制,销售环节的铺货、物流。
由于每个人自身知识的局限性,很难抵达每部书稿的知识边界,单纯依靠人对书稿判断、加工,难免有错谬出现。
杨海平等学者认为:“AI技术的引入正全方位地重塑出版业务流程,选题策划、内容生产和产品推广各环节逐步实现了智能化协同,不再局限于传统的顺序式操作,而是通过数据驱动和实时反馈形成了一个高效、灵活和用户导向的产业生态系统。”[4]
AI以其优秀的逻辑推理能力、机器学习的集大成性、具备扩散性的开放的创造力[5]成为出版领域“最优秀员工”之一。
(一)横向产品研发上,AI为选题策划带来全新理念
AI横向打通了音频、视频、文稿、图片等多种呈现形式,让内容传播再无传统壁垒。如喜马拉雅平台打造自己的AI音频主播“喜小道”,可以将文字内容顺畅转化为晓畅明了、甚至可以通过语音语调传递情感色彩的音频,融合了有声书、纸质书、电子书三者的优势,并能给用户提供丰富的情绪价值。一个手机、一个APP可以赋能一个选题全产品线的呈现形态,让读者获得多种不同层次的内容体验。
AIGC开创了“模型”主导内容生成的时代[6],读者的需要在哪里,市场营销的发力就在哪里,内容生成的方向也就在哪里。高算力、精算法、读者喜好的大数据归类,让出版领域获客变得更直接,圈层划分更加精细。
笔者认为,丰富的数据储备、对热点的持续关注、以问答模式而提升的创造力、可将多种产品形态融合于一体是AI能够重塑选题策划全流程的关键因素。此外,人工智能对数据的筛选,不依凭情感喜好而发生偏移,理性分析市场趋势、读者喜好和销售数据,为出版从业者提供真实有效的选题策划判断标准。
(二)纵向流程整合上,AI使编校环节准确高效
编辑校对是图书内容质量保障的核心环节,在传统出版流程中,这一环节需要六人参与。以初审编辑平均每天(8小时)审读3万字,一校校对5万字计,一部20万字的书稿,需要至少20个工作日的专项时间完成一部图书的编辑校对流转。
在编辑环节,AI可以就书稿的内容优化、结构调整、语言美化等领域给出高效可行的建议。在校对环节,AI可以快速检测书稿中的逻辑错误、语法错误、知识错误等,准确率可达到95%以上。
以某科技公司开发的校对插件为例,一部20万字的书稿,需要15分钟完成初校,再通过人工复核,4小时可完成。比起纯人工初校所需的32小时,效率提升了800%。
三、以《穿越红楼》为例,探索人工智能在经典IP融合出版上的具体实践
(一)互联网内容生产的迭代与特质
自20世纪90年代以来,随着互联网技术的普及,电脑陆续进入千家万户,人类进入了Web1.0时代。在这一时代,互联网内容生成为专家创作时代(PGC)。在这个时代中,强有力的组织力量聚拢行业领域的专家,由他们进行专业的文本创作与筛选,以高质量的精选内容呈现给用户。
进入21世纪第二个十年,随着互联网技术的飞速提升、便携式笔记本电脑的普及、手机等上网终端的广泛应用,人类进入Web2.0时代,与之对应的内容生成模式为用户创作时代(UGC),即通常所说的自媒体时代。创作的专业壁垒被打破,普通用户都可以成为作者,内容呈现丰富多样化,平台与流量成为内容曝光的重要推动力。
随着两代互联网对大数据的海量积累,硬件进步带来的算力提升,软件开发带来的算法精进,人类进入了智能创作时代(AIGC)。人工智能不仅模拟人类的思维方式和工作方法,还催生出全新的产业体系和商业化特征,结合区块链加密技术对知识产权的保护与元宇宙对视觉效果、身临其境体验的高需求,AIGC迎来的高质量内容产出几何级数的增长[7],是Web3.0时代最显著的特征。
AIGC的意义是实现人工智能“内容”生成,核心技术价值是实现了“自然语言”与人工智能的融合[8]。经历了Web1.0至Web3.0三种不同模态的内容生成机制,对图书出版而言,生成式人工智能在文本创作、图片创作、图片转换等领域有着卓越的表现。
《穿越红楼》也通过以上几个方式,跨越互联网三个时代的创作形态,成为一次全新的融合创作与出版探索。
(二)《穿越红楼》如何兼具三代互联网内容生成特点
《穿越红楼》是一部综合了专家创作、用户创作、智能创作于一体的图书。其底本是南京大学文学院教授苗怀明教授“《红楼梦》讲读”课堂的花式作业。
这门全校的通选课是南京大学的爆款课程,以“认认真真读书、一本正经搞笑”的方式自南大校园萌芽,很快传播到长三角地区的许多高校,成为不少师生接触中国古典文学经典《红楼梦》的便捷方式。
其专家创作的特质,集中体现在苗怀明教授精选话题、撰写读书指南与课程纲领等方面,以专业性的眼光规约了这本书的气质不是一本“恶搞”经典的图书;其用户创作的特质,体现在号召选课学生每个人都成为本书的作者,并率先在微信公众号平台“古代小说网”登载了大部分的文字内容,以自媒体的方式吸引互联网读者;其智能创作的特质,集中体现在成书过程中图像的生成、设计与续写型创意文本的生成,是AIGC擅长熟稔的领域。
该书由楔子和十回构成,采用向古典小说致敬的章回体形式著写,出场角色均为《红楼梦》经典中有据可查的人物。
突破小说原有的时间框架和历史时代,创意性地将“90后”“00后”读者日常使用的APP如微信、大众点评、知乎、微博热搜、小红书、抖音直播、求职网站等话语方式、思维习惯与红楼人物融通。
全书插图均由反复训练AI逐步生成,第十回中由人工与AI分别续写了多个《红楼梦》的结局。
机器学习的训练过程主要包括四个环节,分别为:数据获取、特征提取、模型训练与评估应用。[9]本书图片生成式AI的算法、算力相对比较成熟,主要在数据获取与特征提取方面进行了有效的互动尝试。
下文将详细论述AI做图的尝试,比较人工制图与AI制图的区别及其深层原因,比较人工与AI续写结局的文风、逻辑等方面的优长与不足。
(三)《穿越红楼》AI图像生成的探索与分析
2022年8月,在美国科罗拉多州博览会上,数字艺术类的首奖由AI自动生成并通过Photoshop加工的画作《太空歌剧院》摘得。恢弘而细腻的画作兼具了古典画派与未来科幻的双重审美,画作不再是简单的二进制数据堆砌的数字图片,而具备了人的情感,传递了宇宙动静兼具的生命力。[10]这一事件,是生成式AI划时代的事件,从图灵论文中那句“机器能思考吗”到如此震撼、可触及的视觉体验,AI快速走进了普通人的生活。
通过AI形成相对优质的绘画,需要增强AI对图片的理解力,并通过海量数据训练做支撑。人类与AI对图像的思维过程截然不同,人类更多从视觉整体上感知图像,AI则通过拆分像素理解图像。
1.创作部分
图像训练需要通过图文结合的方式,生成式AI的交互指令,通过一张或多张基础图片与分条截取的文字描述生成。
示例一:图文指令,单图人物形象生成(生成贾雨村的律师形象)
首先,上传贾雨村的人物形象,以百度图片自有版权的87版《红楼梦》贾雨村剧照为基础;第二,搜索一个对应90后、00后认知的理想的律师形象作为风格图片输入;第三,输入英文的编辑指令,文字描述越细节越好。
在生成结果中,选择相对理想的图片,就细部进行更多指令输入并生成图片,迭代到理想的图片后,通过Photoshop等软件优化,形成最终用于图书出版的图片。
王文冠等学者指出:“人工智能大模型虽然擅长模式识别和文本/图像生成,但缺乏对生成内容底层逻辑的理解。这一局限在需要理解因果关系、抽象概念或进行复杂逻辑推理的任务中尤为明显。”[11]
通过对单图人物生成的探索,结合人工绘画与人工智能生成图像的思维逻辑,可以得出,相比人工绘画,人工智能的劣势在于生成图像的个性不足,较为扁平化,整体性松散;优势在于可以打磨任何细节,让所有细节的呈现质量标准统一。
基于以上分析,笔者认为,人工绘画与人工智能生成图像应做更紧密的结合,如可以先经过人工绘制整体形象,通过人工智能进行细节完善与立体化渲染,以期获取更良好的成品效果。
示例二:图文指令,依据原文生成静物画面
《红楼梦》第四十一回《栊翠庵茶品梅花雪 怡红院劫遇母蝗虫》部分原文:“刘姥姥因见那各式各样的小面果子都玲珑剔透,便拣了一朵牡丹花样的笑道:“我们那里最巧的姐儿们,也不能铰出这么个纸的来。我又爱吃,又舍不得吃,包些家去给他们做花样子去倒好。”[12]
通过依据原文生成静物画面的形象分析,可以得出,AI在具象化静物生成上基本实现了指令中90%以上的要求。
对于原文的理解,记叙类语句的理解到位,描述类词句的理解欠缺。如原文中谈到的“玲珑剔透”,包含了丰富的中国传统文化隐喻。“玲珑”在许慎的《说文解字》中解释为“玉声”,“剔透”在《广韵》中解释为“刻骨镂冰”,两个词汇并列组合在一起,有“高洁”的文化内涵,也象征了栊翠庵中女子们“不食人间烟火”的仙骨。在生成的静物图片中,并没有较好地呈现这一状态。而这一状态恰是原文文化隐喻之所在。
基于以上分析,笔者认为,对于需要美学提升价值、聚焦点在具体物品的图像生成上,需要对AI的人工指令更加具体化,尤其是描述类词句需要在指令中转化为记叙类语句。
2.风格转化部分
为了打造更加亲近的阅读感,手绘风格是近些年来插图的趋势。对于如红楼美食相关章节,需要具有亲近感的手绘食物图片,该部分尝试了使用AI风格迁移算法。这个算法可以基于输入的条件,改变一个图片的风格。
示例三:生成糟鹅掌鸭信的手绘风格插图
首先,利用百度AI“文小言”作画,输入“糟鹅掌鸭信”,
就生成了一张真实的照片。
使用风格迁移AI算法,输入上图,然后再输入一张手绘风格的图片,就可以输出一张手绘风格的糟鹅掌鸭信。
通过以上三个示例,我们可以总结出生成式AI在绘图方面的优势与不足。从优势上讲,生成式AI算力强大,在训练数据足够丰富的前提下,可以为用户提供较多的可选择性。
几乎所有的人物图片,最传递人物气质的眼神部分,生成式AI基本上都保留了原图的感觉。从不足上看,AI生成图片普遍整体性和浑然性缺失,能够看得出较为明显的粗粝感,这种感受恰好对应了AI认知图片的底层逻辑是像素。
2021年 DeepMind团队让 AI与数学家进行合作,在拓扑学和表象理论方面证明了两个数学新猜想;感知技术(如脑电、眼动技术等)可以数据化表达视觉、听觉、触觉等感官信息,揭示深层次的人类艺术审美、情感认知过程。[13]
这一猜想的实现对AI生成图片至为重要,是人工智能从图像生成到NFT艺术品创作的关键。生成式人工智能应通过更多数据分析,精进算法,传递人类画作蕴藉的情绪与文化隐喻。
利用风格迁移算法生成的更多手绘图片(火腿炖肘子、鸡髓笋、小荷叶儿小莲蓬儿的汤、烤鹿肉,来自豆包)
(四)《穿越红楼》AI文本创作的探索与分析
AI在文本创作中有巨大的数据与算力优势,对于简单文案,AI往往可以通过基础指令与多信息源提供实现。对于需要理解并加以创意的续写类文本,是考验AI处理文本自由度、开放度的重要指标,也一直是AI参与创作的重要领域。
2017年,AI机器人在阅读了英文版《哈利·波特》全集后,创意性地写出了《哈利·波特与看起来像一堆灰烬的肖像》。云波诡谲的故事情节甚至将伏地魔变成孕妇,让罗恩变成蜘蛛。故事情节的荒诞不经,主要因为当时AI算法的狭窄与单一,尽管如此,生成式AI还是在续写类文本上呈现出了较强的能力。
续写《红楼梦》结局,是许多创作者津津乐道的尝试。《穿越红楼》也特开辟结尾的一回,利用人工与生成式AI做了续写尝试。
1. 人工续写的结局
且说那贾宝玉自悬崖撒手、弃而为僧后,并未曾寻得个庙宇栖身,而是做了个游方僧人,四处游历,见了些兴衰,经了些离合,心里倒也渐渐明白了些许。
这一日,正值数九寒冬,宝玉独自一个蹒跚而行,忽见一僧一道远远而来,生得气骨不凡、丰神迥异,宝玉心神一动,迎向那僧道:“二位仙师!弟子有礼了。”那僧道亦答礼相问。
宝玉因说道:“弟子经了这半生富贵、一遭流落,已有超脱己身之意。然心头始终有一股意气盘桓,却是割舍不下这身子。今日得见仙师,忽觉可以了结,还望仙师指教。”那道人因笑道:“你这佛门子弟尘缘未断也。那僧笑道:“左不过是一干风流冤债罢了。”
2.AI续写的结局(来自通义千问)
编辑指令:参考以下文字,重新写一个《红楼梦》结局,要和下面的片段完全不同,需要符合《红楼梦》原文的中国古典小说文风,让贾宝玉回归幻境。
却说那玉飘然而去之时,宝玉脑中似有一线明光闪过,恍如初醒,心中百感交集。他凝望那僧道远去的背影,默然不语,愈发觉这世事如梦,荣华似水,回首皆空。
宝玉于寒风中怔怔立了半晌,忽然觉脚下一轻,四周景物霎时变换,竟重又见得那日幻境。只见云雾缭绕,仙乐飘飘,众仙娥迎面而来,眉目如画,正是昔日于太虚幻境中所见诸仙。宝玉心下恍然,知是梦中之梦,然此梦已非彼梦,一切更觉虚幻缥缈。
以上两段引文,分别为人工与通义千问AI续写《红楼梦》结局的摘录。
雷雯等学者通过AI写作训练分析得出:“AI大语言模型在文学创作上的最大挑战也来自语言,其在人机交互的创作过程中无论如何也无法克服‘语言失真’的问题……指AI在文学创作中存在着的语言结构死板、意象重复、修辞简单等原因导致的语言平庸的问题。”[14]
通过对比,笔者发现,两个续写都符合古典小说的特点,也契合了《红楼梦》“白茫茫一大片”的现实结局,文字辞藻皆有古典小说的质感。
人工续写的部分,侧重于人物对话,以僧道与宝玉言简意赅的问答,勾勒了宝玉内心的成长,人工续写更善于借助具体场景构建故事,以情节取胜。AI续写则通过辞藻营造了比较浓郁的氛围,通过环境描写衬托荣华散尽如逝水之感,画面感强烈,更侧重小说三要素中“环境”的深耕。
通过比较不难发现,AI在文学续写上,基本可以实现逻辑自洽及氛围烘托,但情节的机械、辞藻的堆砌、感情的空洞是显而易见的;但从情节入手,人工续写更贴近人类的内心活动,更能体现出刹那顿悟之感,感情表达的细腻程度是AI续写难以望其项背的。
拥抱科技,是出版融媒转型的必由之路。随着智能创作时代的来临,出版从业人员将面临较多的选择与判断,也需要重新思考出版物的价值定位。
生成式AI的数据库强大到远超任何个体人类的认知边界,对于出版从业人员来讲,作品生成的判断将是选题策划中一道高要求的门槛。AIGC在版权问题、欺诈问题和违禁问题等方面均给出版从业人员提出了全新的判断要求。
生成式AI成果存在来源、指令设计、生成成果三方面的知识产权问题。目前,《著作权法》规定,作品是指文学、艺术和科学领域内具有独创性并能以某种有形形式复制的智力结果。
2022年11月3日,国家互联网信息办公室、工业和信息化部、公安部联合发布《互联网信息服务深度合成管理规定》,对“深度合成”的内容边界、传播边界和管理做了规约。国际上,美国版权局承认,人工智能生成的内容随后被编辑或用于编辑已有的内容,则可以获得版权;法国已承认AI属于独立创作者;加拿大认为AI的训练者或使用者是著作权的拥有者。
这表明全世界国家在鼓励科技发展的同时,已经注意到的法律界定。对于出版从业者来讲,厘清人类智力与人工智能成果之间的区别,对原创人类智力成果加强保护是工作重点。
在Web3.0时代,出版业面临着从劳动密集型产业向科技产业转化的契机。中国工程院院士高文认为:“大模型在可预见的未来仍是通用人工智能发展的主要方向。”[15]2025年春节前夕,由深度求索公司研发的DeepSeek V3.0版本正式发布。
作为开源大模型的人工智能软件,其优化后的算法逻辑极大降低了训练成本。短短一周内,用户破亿;日活用户在3周内突破3000万大关,超越“豆包”并接近ChatGPT的一半。DeepSeek以其具备情感力的用户体验、创意力的写作成果和严谨的逻辑推理能力成为生成式AI的黑马。
通过对《穿越红楼》AI全流程参与的探索,笔者认为,出版从业人员应当辩证看待人工智能:一方面将人工智能作为一种高效率的生产工具,在流程化推进上发挥其高效准确的作用;另一方面,将由人工智能释放出的生产力更多用于创意型策划领域,让图书产品提供给读者更多情绪价值;第三方面,应对人工智能带来的信息获取的便捷,快速拓宽知识边界,提升甄别能力。
出版从业人员应与人工智能找到适合的相处方式,让科技为人工智慧赋能,使经典IP焕发人工智能时代的崭新活力。
注释:
[1] 訾希坤,马铁立.“5G+AI”视域下三维码融媒书出版研究【J】.出版广角,2021(24):68.
[2] 杜雨,张孜铭.《AIGC:智能创作时代》【M】.北京:中译出版社,2023:15.
[3] 江小涓,宫建霞,李秋甫.数据、数据关系与数字时代的创新范式【J】.中国社会科学,2024(9):188.
[4] 杨海平,冯明会.人工智能赋能出版产业深度融合发展:现状洞察、发展困境与实践路径【J】.中国编辑,2024(12):47.
[5] 朱嘉明.AIGC和智能数字化新时代——媲美新时期时代的文明范式转型.见杜雨,张孜铭.《AIGC:智能创作时代·代序》【M】.北京:中译出版社,2023:II-V.
[6] 朱嘉明.AIGC和智能数字化新时代——媲美新时期时代的文明范式转型.见杜雨,张孜铭.《AIGC:智能创作时代·代序》【M】.北京:中译出版社,2023:III.
[7] 朱嘉明.AIGC和智能数字化新时代——媲美新时期时代的文明范式转型.见杜雨,张孜铭.《AIGC:智能创作时代·代序》【M】.北京:中译出版社,2023:VIII.
[8] 朱嘉明.AIGC和智能数字化新时代——媲美新时期时代的文明范式转型.见杜雨,张孜铭.《AIGC:智能创作时代·代序》【M】.北京:中译出版社,2023:I-II.
[9] 杜雨,张孜铭.《AIGC:智能创作时代》【M】.北京:中译出版社,2023:50.
[10] 杜雨,张孜铭.《AIGC:智能创作时代》【M】.北京:中译出版社,2023:9.
[11] 王文冠,杨易,潘云鹤.大模型时代的视觉知识:回顾与展望【J】.浙江大学学报(英文版),2025 26(1):1-19.
[12] 曹雪芹.《红楼梦》:(上)【M】.北京:人民文学出版社,2022:553.
[13] 江小涓,宫建霞,李秋甫.数据、数据关系与数字时代的创新范式【J】.中国社会科学,2024(9):193.
[14] 雷雯,徐璀玉. AI写作:文学的生长还是停滞——基于“人机合写”测试的分析【J】.艺术评论,2025(1):30.
[15] 高文.抢抓人工智能发展的历史性机遇【N】.人民日报2025-2-24,第9版.
长胜证券-长胜证券官网-陕西股票配资公司-免费杠杆配资门户网提示:文章来自网络,不代表本站观点。