今年年初,随着GPT-4和文心一言的推出,我们也迎来了人工智能元年。
如今,全国各地都有各种人工智能学习课程和社区,网络上每天都在不断刷新关于人工智能的讨论。
有人效仿并讨论,有人对此嗤之以鼻,但更多人还处于对AI知之甚少的阶段。 面对每天的国内外信息轰炸,他们无法辨别真假,也无法了解全貌。
作为一名深度AI用户,今天我将为大家对当前AI领域一些热门术语和概念进行简洁易懂的解释,同时也揭露这些概念背后的技巧和业务。
01 数字人
最近,数字人的概念非常流行,但这并不是什么新技术,早在2-3年前就已经非常成熟了。 但你有没有想过为什么现在不流行了呢? 因为成本!
目前比较流行的是所谓的数字真人直播。 其基本原理并不复杂。 说白了,就是提前制作一段数字人视频,然后在直播间循环播放。 所谓24小时直播,就是1小时的视频循环24次,那为什么不能直接制作一个24小时的数字真人视频呢? 当然可以,不过我给你一个想法,所谓数字人视频生成,一分钟的行业报价在XX元范围内(不要砸行业饭碗,价格换成XX) ,假设每分钟20元,一天1440分钟,成本也差不多3万,你觉得你卖的货能回本吗?
而真正了解直播运营的人应该知道,直播间里最怕的就是屏蔽直播。 如果你24小时循环播放一个视频,你觉得平台会坐视你破坏平台生态吗?
而且数字真人直播的交互和表达都比较生硬,声音不真实(当然可以用语音克隆来解决),影响观看体验和转化。 另外,它无法解决信任问题,所以不用担心数字人更换主播,更不用担心数字人裁掉某某人。
当然,这并不意味着我否定数字人,因为我和我在为客户提供的数字营销解决方案中都有这些内容。 作为矩阵流量的信息分发,数字人具有一定的优势。
只有了解了底层逻辑,搭建了营销框架,并嫁接其他技术和运营,然后利用数字人,才能真正用好它,用好它,而不是被黑科技噱头所诱惑。
02 开放人工智能
ChatGPT 之母 OpenAI 于 2015 年由一些最著名的科技领袖联合创立:Elon Musk(据称已辞职)、Sam Altman、Greg Brockman 等。 最初是一家非营利性研究机构,目标是通过开发和推广AI技术来促进人工智能的安全和发展,后来转型为营利性公司ai漫画人物生成器关键词,与谷歌、微软、亚马逊、Facebook等密切合作公司。
OpenAI在人工智能领域,特别是在自然语言处理(NLP)领域取得了一系列重要突破。 其主要成果之一就是火遍全球的GPT系列型号吉祥物,从GPT、GPT-2、GPT-3到GPT-4。 这些模型展示了强大的语言生成能力,可用于聊天机器人、内容创建、翻译、问答系统等各种应用场景。
除了GPT系列模型之外,OpenAI还成功开发了DALL-E(用于图像生成)、CLIP(用于图像识别和生成)、Codex(用于代码生成和程序理解)等其他创新技术。
近期,OpenAI 投资了一家人形机器人公司 1X Technologies。 不仅是资金支持,ChatGPT等大规模语言模型也将支持机器人产品的开发进程。
03 ChatGPT3.5和GPT-4的区别
ChatGPT3.5是一种自然语言处理模型,通过使用大量训练数据来模拟人类语言行为。 它可以根据上下文和上下文提供答案,像人类一样聊天和交流ai漫画人物生成器关键词,完成编写脚本、文案、翻译和代码等任务。 。
GPT-4最新迭代升级为拥有5000亿个参数的多模态模型,远超GPT-3.5的1750亿个参数。 它可以理解各种形式的信息,具有图形和文本识别能力,大大提高了文本输入限制和记忆力。 ,保证了更高的准确性和逻辑性,被认为是目前最强的AI。
●ChatGPT3.5可以通过免费注册帐户获得。 如果您想使用 ChatGPT-4,则必须在 ChatGPT 帐户上升级。 目前,已经是20个月了。
●从用户的角度来看,ChatGPT-4具有更好的生成能力,可以处理非常复杂的逻辑问题,比ChatGPT3.5进步很多,但GPT4版本的处理速度比3.5慢,并且设置每3小时25题限制。
04 百度飞桨
Paddle是百度开发的开源深度学习平台。 它于2016年正式宣布开源。它支持多种硬件环境,包括CPU、GPU和ASIC。 它具有良好的可扩展性和并行计算能力,可广泛应用于计算机视觉和自然语言领域。 处理、语音识别、推荐系统等领域。
文心大模型是飞桨重要的基础模型库,也是“文心”系列产品的基础模型。 主要是给开发者用的卡通形象,普通人暂时用不了。
05 一句发自内心的话
百度针对ChatGPT推出的知识增强型大语言模型和生成式AI产品也具备多模态生成能力,是我们自己国产的AI。
虽然文心一言在编程、算力和应用生态方面确实不如GPT-4,但GPT-4尚未开放图像生成的外部测试,而基于文心一言,文心一言已经具备了生成图像的能力。 但这一代人仍处于“轻度智障”水平。 之前有网友输出具体关键词测试,发现文心一言生成图片时,疑似先将中文转换成英文,然后AI根据英文意思生成对应的图片。 不过,这个问题后来得到了解决。
另外,我在使用文心一言时,发现它在演绎推理、逻辑推理等领域的表现略逊于GPT系列模型,是通过“搜索引擎”来弥补的,类似到 ChatGPT,无需搜索即可生成。 回答技术差异很大。
06 人工智能绘画
AI绘画并不是一项新技术,它已经出现了几年,但在ChatGPT带动的AI热潮下再次被推到风口浪尖。
人工智能绘画最初使用对抗生成网络(GAN),它由两个相互竞争的神经网络组成:生成器和判别器。 生成器负责创建新图像,而鉴别器负责评估生成的图像与真实图像的相似程度。 在训练过程中,两个网络不断相互竞争以提高生成图像的质量。 最终,生成器可以生成逼真且具有艺术价值的作品。
2020年后,AI绘画的算法升级为扩散模型,生成图像的质量更高。 目前主流的AI绘画工具都是采用这种模型构建的。
目前朋友圈、社区讨论最多的AI画作主要是《稳定扩散》和《中途》。
07 稳定扩散
Stable Diffusion 是 Stability AI 开发的文本到图像神经网络模型。 简单来说,稳定扩散可以将描述性文字变成生动的图片。 朋友圈里各种假真假假的早年美女图,基本上都是基于SD中Lora模型的训练。
Stable Diffusion在应用中的优势包括快速生成高质量的图像,只要给定的参数合适,就可以生成堪比摄影照片的逼真图像。
但SD对机器的性能要求很高,这对于普通人来说是一个巨大的门槛,而且参数命令(prompt)只接受英文。 中国人在使用时一般都是通过翻译工具来实现命令输入,中西语义理解上的偏差会是不小的障碍。
要下载 Stable Diffusion,请访问 Hugging Face 网站 ( ) 并搜索“Stable Diffusion”。
对于初学者,建议使用预训练版本。 安装可以参考Hugging Face上的文档,按照教程一步步完成安装()。
稳定扩散训练图
08 中途
Midjourney和Stable Diffusion是目前最火的AI绘画软件,两者都可以通过输入文字生成令人惊叹的AI图像。 Midjourney 是一项在线服务。 与可以部署在本地的Stable Diffusion相比,它只能在互联网上使用,并且需要付费。
● 门槛上,Midjourney是共享服务器绘图通道,需要科学准入和收费(有免费试用25次的限制,但最新消息,由于中国用户大量免费测试,创始人MJ 今天发推文暂时关闭免费试用许可)。 但Stable Diffusion需要本地安装部署,对显卡要求较高(N卡、入门级8G显存)。 付费版目前30/月,标准版性价比更高。
● 在玩法上,中途学习和训练大量的图像特征和风格,生成多风格的作品,适合提供创作灵感来源。 Stable Diffusion通过大规模模型迭代图像来生成高质量的图像,可以更准确地生成和调整你想要的图像内容。
● 就优点和缺点而言,中程适合各行业的美术工作者。 它易于使用,并提供了灵感素材的来源,但无法在细节上进行微调,其商业可用性值得怀疑。 Stable Diffusion适合项目型美术工作者进行协作,提高效率,但有一定的学习成本。
总体来说,中途操作效率较高,稳定扩散时间成本较高,但可玩性较高。
如果你想体验AI生成,可以尝试Stable Diffusion,如果追求效率,可以选择Midjourney。 作为一名插画师,你可以先使用 Midjourney 来获得灵感和风格,然后使用 Stable Diffusion 来高效地完成工作。
09 温馨一歌
百度依托飞桨和文心大模型的技术创新,于2022年推出首款“AI画画”产品,文心的“好姐妹”。
输入文字,选择绘画风格(国风、油画、水彩、水粉、动画、写实),用单一的文笔就可以根据数据模型快速制作一幅画。
如果您不知道如何更好地描述图片,您还可以使用“关联”功能,平台会推荐可能满足您描述的图片。 同时,文心一格还支持上传参考图片的功能。
正如前面提到的,不少网友发现《文心壹格》似乎对某些成语理解能力较差,网友怀疑其使用了英文标注的开源图片素材进行训练,因此需要中英翻译作为提示(提醒词)。
百度对此回应称,其开发了完全自主研发的模型,使用全球互联网的公开数据进行训练,并将快速调优和迭代。 根据事后网友的测试,确实进行了优化。
但可以预见的是,在很长一段时间内,“不完美”仍将是百度AI的关键词。
10 条提示
无论是与 ChatGPT 对话还是使用 Stable 扩散绘图,提示都是获得准确结果的关键。
提示就像人工智能的“野兽”训练师。 他们不知道如何使用提示。 对你来说,AI可能是一个谈论轮子的弱智对话框。 而学会提示,可以引导AI真正发挥超级算力,产生极高水平的内容,真正让AI为我们所用。
以前需要编程语言,现在通过提示就可以实现,大大降低了人类创造与人工智能之间的门槛。