首页IT科技ai绘图的基本操作(AI绘画火爆,到现在还只是冰山一角?AIGC掀起当代新艺术浪潮)

ai绘图的基本操作(AI绘画火爆,到现在还只是冰山一角?AIGC掀起当代新艺术浪潮)

时间2025-05-01 16:31:36分类IT科技浏览2844
导读:前言: hello,大家好我是Dream。近日,各大社交平台掀起了一股“AI绘图”风潮,很多同学朋友纷纷在社交平台上晒出了属于自己的AI照片,一时间AI相关话题热度高涨。那对于AI绘画以及开启AI内容创作新时代的昆仑万维你究竟了解多少呢?那么今天我就带大家走进...

前言: hello          ,大家好我是Dream          。近日               ,各大社交平台掀起了一股“AI绘图          ”风潮     ,很多同学朋友纷纷在社交平台上晒出了属于自己的AI照片     ,一时间AI相关话题热度高涨               。那对于AI绘画以及开启AI内容创作新时代的昆仑万维你究竟了解多少呢?那么今天我就带大家走进AIGC的新时代               ,去探寻昆仑万维的发展领军之路!

一          、AIGC是什么

说到AI绘画大家一点也不陌生          ,但可能提到AIGC很多同学就不清楚了     ,其实AI绘画是属于AIGC应用分支之一的               ,也属于元宇宙的范畴     。那什么是AIGC?AIGC全称为Artificial Inteligence Generated Content          ,即人工智能生产的内容          。

随着人工智能的发展,AIGC赛道火热               ,各大科技公司正纷纷入局               ,并且在这个数据积累               、算力提升和算法迭代过程中,人工智能在逐步渗透在写作     、编曲          、绘画和视频制作等创意领域               。

二               、为什么说昆仑万维开启AI内容创作新时代

作为中国领先的互联网平台出海企业          ,昆仑万维近年来在不断夯实出海业务的同时               ,也在持续加强人工智能等技术的研发投入     ,加码元宇宙     、AIGC     、VR          ,促使多元业务协同发展               ,让昆仑万维在AIGC赛道取得了突破性进展     。目前     ,昆仑万维海外信息分发元宇宙平台Opera               、海外社交娱乐平台StarX          、全球移动游戏平台Ark Games

是海外市场的核心业务     ,在规模上覆盖了一百多个国家               ,形成全球月活用户数近4亿的庞大业务矩阵     。

AI绘画的技术门槛其实很高               。但我们也可以看到现在在各大平台都出现了类似的AI绘画功能          ,这是因为Stability AI公布了一个开源模型     ,只要有一定的技术能力都可以跑起来          。但想达到一些细节性的生成效果               ,光靠开源能力还不够     。真的做到商用级别          ,还得团队自己有算法级别的优化创新               。除了AI绘画,AIGC技术还能应用于文字     、图像               、视频          、语音、代码               、机器人动作等多种内容形式的生成          。 作为行业先行者----昆仑万维               ,在AIGC领域具有绝对意义的发言权!

昆仑万维在AIGC领域已经投入了近两年的时间               ,成立MusicX Lab音乐实验室,目前已经正式销售AI作曲          ,并且其已经准备长期都会在AIGC领域继续进行大幅投入。

“昆仑天工               ”是由昆仑万维集团与合作伙伴奇点智源推出的全系列AIGC模型与算法               ,AI生成能力覆盖图像               、音乐、编程          、文本等全模态领域               。那么接下来我就对昆仑天工的使用体验为大家做一点简单的介绍!

三               、昆仑天工使用体验

1     、四大世界顶尖开源模型

绘图:全国第一款多语言Stable Diffusion分支模型

昆仑天工在绘画领域使用了第一个中文 Stable Diffusion 的模型和中英双语 Stable Diffusion 模型               。

Stable Diffusion是一个文本到图像的潜在扩散模型     ,它使用来自LAION-5B数据库子集的512x512图像进行训练          ,使用这个模型               ,可以生成包括人脸在内的任何图像。

该模型利用已经开源的太乙 CLIP 模型替换了英文 stable-diffusion-v1-4 中的语言编码器          。同时其采取了两阶段的训练               。第一阶段也是冻住 stable-diffusion的生成模型部分     ,在亿级别的高质量数据上微调语言编码器     ,调整学习率等超参数               ,训练语言模型中文部分的表征     。第二阶段 放开

stable-diffusion的生成模型部分          ,增强中文引导图片生成的能力          。

这是我自己用其生成的一些AI绘图     ,我用的关键词是雾气弥漫的森林瀑布溪流阳光城市印象               ,可以说画的也是非常漂亮          ,很好的展现出了我的内心世界:

可以看出该产品当前在同行业处于较为领先的地位,出图速度十分迅速               ,在10s以内               ,这可以算是在同行中最快的一个啦!并且图片风格与用户指令契合度高               。支持双语,英文系统做的较好          ,昆仑天工也将继续去完善提升整个模型               ,将会有更多语言的提示词输入支持     ,更强大的语言生成          ,模型指导图像生成风格更加多样               ,增加更多艺术风格的支持支持用户对生成的图像进行二次提示词编辑图像等功能     。

文本:全国生成效果最好的开源GPT中文预训练大模型

GPT-整体架构:

GPT使用了transformer的decoder部分

     ,每层Trms构成了一个自左向右单层的transformer     ,总共堆叠了12层Trms     。GPT去掉了原先decoder中使用encoder进行attention的部分               ,每层Trms只有一个 Masked Multi Self-Attention          ,即:768 维向量+12个Attention Head               。

GPT模型能较好的处理NLP各个应用领域的任务     ,比如文本分类               ,推理          ,对话,问答               ,完形填空               ,阅读理解,摘要          ,生成等等          。百亿/千亿参数量级的GPT大模型作用在这些应用领域     。

昆仑天工针对中文领域构建了千亿级别的高质星数据集               ,通过高性能集群     ,训练(200张显卡          ,训练了4周               ,后续优化合计2周)得到百亿参数星的GPT-3生成模型基于预模型     ,对于更具挑战性的任务持续深耕     ,迭代优化               ,专业性表现中进一步提升               。在未来其将会开发更大的参数量          、更多的专业领域级多模态          。

编程:国内最好的一款多语言开源编程大模型

Sky-code 是 SingularityAI 研发的一款AI代码生成工具          ,支持各种主流编程语言     ,助力开发人员更快更好的编码。Sky-code 可以直接集成到编辑器中               ,无缝衔接在开发环境          ,在键入代码的同时,智能高效补全代码               ,提升工作效率               ,节省开发时间               。 Sky-code 目前已经集成在了 Visual Studio Code 中,未来会支持更多平台和工具          ,如 Neovim               、JetBrains IDE     、Visual Studio 等               。致力于为开发者解决琐碎的     、重复性的代码工作               ,从而专注于更高价值的研发工作。

简单易用

SkyCode作为编辑器扩展提供服务     ,可以无缝融入到您的开发环境          。

提升工作效率

天工SkyCode可以直接集成到您的编辑器中          ,无缝衔接在您的开发环境               ,在您键入代码的同时     ,智能高效补全代码     ,提升工作效率               ,节省开发时间               。目前我们已经集成在了 Visual Studio Code 中          ,后续会支持更多平台和工具     ,如 Neovim               、JetBrains IDE          、Visual Studio 等

人工智能驱动 SkyCode由SingularityAI自研的大模型提供支持               ,在GPT-3 13B基础上进行微调后重新训练          ,是国内最优秀的代码补全模型     。预训练模型GPT-3参数量高达1750亿,代码质量严格把关               ,优中选优模型吞吐海量代码               ,每秒输出百字代码以上          。

音乐:国内第一款商用级开源作曲AI模型

昆仑万维的StarXMusicXLab音乐实验室完成首批五首完全由AI作曲的歌曲发布,目前这五首歌曲已在Spotify     、SoundClould               、QQ音乐和网易云音乐等海内外180余个音乐平台上线               。

StarXMusicXLab是昆仑万维在 “AI赋能     ” 业务发展战略方向上的又一重大成果          ,对相关业务及整个行业之后发展均具有重要意义               ,能够丰富平台内容     ,同时为个人用户和企业用户          ,提供音乐相关解决方案               ,包括批量供给如背景音乐          、伴奏配乐等泛化内容     ,以及为艺人及虚拟偶像定制化创作符合其人设调性的音乐作品等服务     。经过StarX科研人员四、五年的努力     ,昆仑万维能够实现将人声从歌曲中分离出来               ,从而建立起庞大的高质量伴奏曲库     。昆仑万维的人声消除技术应该是目前世界上最好的          ,凭借这项技术建立起了覆盖300万首曲子的伴奏曲库     ,这也是世界上最大的流行音乐伴奏曲               。

2.数据集优质数量大               ,模型能力强

数据越多          ,训练的质量也就越好,模型质量也就越高          。昆仑万维通过AI去学习曲库中的300万首乐曲               ,就能够生成高质量的               ,由人工智能创作的音乐     。

文本模型对比 通过模型文本对比我们可以看出来其在各种评分中是相当优秀的,在blue评分中更是高达17.27          ,这非常有利的说明了其:

计算速度快               ,易于理解               。 它与人类评估相同文本的方式相对应          。 重要的是     ,它与语言无关          ,因此可以直接应用于您的 NLP 模型。 当您有多个基本事实句子时               ,可以使用它               。 它的使用非常广泛     ,这使得将您的结果与其他工作进行比较变得更加容易

代码模型对比:

在代码模型中     ,其百次的通过率更是达到了惊人的80%以上               ,这是一个相当优秀的数据          ,模型的生成通过率相当可观               。

模型的一次生成通过率是代码语言生成模型最重要的能力衡量指标。昆仑天工采用了OpenAI发布的HumanEval以及奇点内部纂写的的40Simples

两个函数级代码生成任务的数据集作为评测目标          。

这是HumanEval中一个非常简单的例子:

昆仑天工生成的代码需要通过单元测试(Unit Tests)才被认为生成正确               。

值得一提的是     ,26亿参数的SKY-CODE模型(PASS@100=84.77%)超越了GPT-J(PASS@100=80%)接近60亿参数的模型结果     。在两种数据集上               , 26亿参数的模型超越了接近70亿参数的模型效果          。在训练的充分程度上          ,SKY-CODE是所有模型中所用数据量以及计算量最小的模型,这一结果充分说明了SKY-CODE数据集构建策略和分阶段训练设计的合理性               ,并展示了采用这种方式能够在函数级代码生成这一最重要场景上达到业界最优               。

3.未来发展前景巨大

随着人工智能技术的发展与完善               ,AIGC将成为这个时代内容创造的主流     。StarX MusicX Lab推出AIGC歌曲,释放AI的落地场景          ,带来了巨大的内容创作想象空间     。作为昆仑万维 “AI赋能          ”

业务发展战略方向上的重大成果               ,StarX MusicX Lab将继续依托成熟专业的全链路音乐制作和发行能力     ,向全球输出高质量的AI创作内容          ,增强昆仑万维业务矩阵的协同效应               ,助力各领域实现降本增效               。

AI作为连接虚拟世界与真实世界的纽带     ,是构建元宇宙的关键基础技术之一          。而AIGC的成熟有利于降低成本     ,带来数字人               、虚拟场景               、数字内容及图文视听相关产品的改变和丰富     。昆仑万维助力多元化业务协作发展多向赋能               ,在AIGC赛道上躬身前行持续发力          ,丰富AIGC多场景应用     ,引领行业发展               。

🌲🌲 好啦               ,这就是今天要分享给大家的全部内容啦          ,希望你看完之后也可以有些许的启发和感悟,我们都在路上               ,一起加油吧!

❤️❤️❤️如果你喜欢的话               ,就不要吝惜你的一键三连了~

最后,有任何问题          ,欢迎关注下面的公众号               ,获取第一时间消息、作者联系方式及每周抽奖等多重好礼! ↓↓↓

创心域SEO版权声明:以上内容作者已申请原创保护,未经允许不得转载,侵权必究!授权事宜、对本内容有异议或投诉,敬请联系网站管理员,我们将尽快回复您,谢谢合作!

展开全文READ MORE
springboot前后端怎么交互(一个简单的springboot+Vue前后端框架搭建) 多目标跟踪应用场景(【Deep-sort多目标跟踪流程及其改进方法的解读】)