纲目快播韩国伦理电影
让 AI 大模子,更低老本、方便易用、高效膨胀。
念念象一下,你站在一派开阔的臆造宇宙前,目前是一幕幕由东谈主工智能全心编织的影像——维妙维肖的东谈主物、花花绿绿的所在、扣东谈主心弦的故事。这不是科幻演义的情节,而是大模子本领带来的践诺。
2024 年,跟着 Sora 本领的秀丽登场,东谈主们见证了智能创作的惊东谈主冲破,它不仅颠覆了传统影视制作,更在东谈主工智能边界掀翻了一场潜入的变革。
01 潞晨科技携自研 Colossal-AI 本领重磅来袭
当伊隆·马斯克对 Sora 本领拍案叫绝,颂扬其为「东谈主类愿赌服输」的翻新时,咱们就知谈,这不单是是本领上的飞跃,更是对改日智能宇宙的一次斗胆预言。从好意思国到中国,从一级阛阓到三级阛阓,生成式模子的上升像悠扬雷同扩散至全球每一个旯旮,激起了巨额创业者和科技青睐者的无穷遐念念。
可是 Sora 模子并未开源,抖擞的算力检会老本也让繁密科研学者和设立者退缩三舍。
尤洋解释在东谈主工智能本领刚兴起时即机敏温雅到东谈主工智能的算力瓶颈问题,并在 2021 年指引潞晨科技团队发布面向大模子的Colossal-AI 深度学习加快系统,使得 AI 检会冒失膨胀到数千个处理器而不耗费准确性,为大模子的检会、微缓助推理任务提供了高效低老本的处理有蓄意。
器具也曾开源便引爆全球温雅热门,成为可膨胀东谈主工智能边界发展最快的开源名目之一。潞晨科技进一步推出了以 Colossal-AI 系统为中枢的潞晨云平台,预置丰富的大模子镜像,以极致性价比和简捷的操作,为科研东谈主员和大模子设立者提供了快速接入高端算力的路线。潞晨云平台杀青了大模子洽商老本的大幅度压缩,器具也曾灵通便引爆全球温雅热门。在算力颠倒稀缺的配景下,这项冲破对东谈主工智能边界带来了潜入纠正。
02 潞晨云平台:大模子智能创作的新引擎
潞晨科技推出的潞晨云平台,以其算力罗致的等闲性、界面的简易易用性、以及预设的 ColossalAI 有关镜像,为科研东谈主员和大模子设立者提供了一个快速接入高端算力的新路线。它让每一位创作家皆冒失闲暇地在智能创作的海洋中航行。
成人游戏不管是视频生成、图像制作照旧文本生成创作,皆变得九牛二虎之力。
用户使用 Open-Sora 生成的视频 Demo
念念跑起来 Open-Sora 等 AI 任务,还需要有 GPU 等算力因循。目前主流的 AI 云主机有 AWS、AutoDL、阿里云等。但 GPU 资源不仅上流稀缺,供应商广阔还条件使用者必须事先进行高额插足,按年或提前数个月预支定金。潞晨云不仅提供了方便易用的 AI 处理有蓄意,还为奋勉为浩荡 AI 设立者和其他提供了随开随用的低价算力:
H800:最稳妥处理大范围模子(数十亿到上百亿参数),具有苍劲的散布式洽商和数据处理武艺。
H800 竖立:NVLink: GPU:8 x H800-80G SXM NVLink CPU:2 x 8470-52c 内存:32 x 64G 集群集聚:8 x 400G RoCE 系统盘:2x960G NVME 腹地存储:4*7.68T NVME
A800:稳妥大范围深度学习模子的检会和高性能洽商任务,颠倒是在需要高内存和高带宽的情况下。
A800 竖立:CPU:2*Intel Xeon Platinum 8358P @2.60GHz 32 核 内存:1024GB 硬盘:2*SSD 960G+ 1*7.68T NVME SSD 集聚:4*200Gbps IB 洽商+2*200Gbps IB 存储预留+2*10Gbps Eth NIC GPU:8*Nvidia A800 80G SXM + Nvlink
4090:稳妥中型到大型模子的检会和推理,适勾搭为高性能AI设立职责站。
4090 竖立:CPU:Intel 8352V*2 内存:DDR4 3200 64G*16 系统盘:480G SATA SSD*2 raid1 数据盘:3.84T NVME U.2*1 GPU:4090 涡轮版*8 网卡:25G 光口网卡 (不含模块) * 2 raid 卡:raid 卡*1,因循 RAID 0,1,5,6,10,50 和 60,带缓存 电源:冗余后电源 4000W 以上,因循 热插拔 管制卡:费力 BMC 管制
03 创作家说
使用 FaceFusion 等器具创作
AI 换脸的数字东谈主短视频绘
@Jack-Cui 博主
当今 AI 数字东谈主很火,各式数字东谈主带货通过提前录制含有特定行动的视频,然后哄骗 AI 换脸算法,驱动东谈主脸的面部格式和行动完成创作。UP 主共享了我方使用 FaceFusion 开源器具在潞晨云平台的 4090 显卡完成的视频名目。并将其制作成打包成一键启动懒东谈主包,不错使用云平台一键启动镜像进行洽商。
UP 主说:「罗致创建一个新的云主机,罗致 4090 显卡一般就够用了。4090 性价比很高,目前每小时只需要 1.59 元。天然这里也有性能更强 80GB 显存的 H800 和 A800。镜像这里填写 UP 主为寰球准备好的镜像,点击创建即可。祝寰球玩得雀跃。」
使用 Stable Diffusion 和 Open-Sora
等器具创作绘本故事
@Crossin 的编程教室
Crossin 同学也使用潞晨云创作和投稿了一个绘本故事短视频。
脚本:率先是创作故事脚本。UP 主的念念法是用 Meta 前阵子刚刚发布的开源大说话模子 Llama 3 赞理完成。作家创作了一个四格卡通连环画的脚本,主角是一只念念学作念饭的猫,并让模子提供配图的中语阐扬和英文教唆词。1 curl -fsSL https://ollama.com/install.sh | sh
2 ollama serve
3 ollama run llama3
绘制:有了脚本和教唆词,作家接下来运行绘制插画。潞晨云默许提供了 Stable Diffusion WebUI 的镜像,罗致此镜像创建主机后(冷漠罗致 1 卡 H800 机器),平直启动网页版的 StableDiffusion。把 llama3 生成的教唆词贴进去稍作修改,设定下出图的数目,就能获得与剧情配套的插图。然后 UP 主尝试使用了潞晨云提供的提供了 OpenSora 的镜像进一步将插图变为动态实质。1 cd /root/stable-diffusion-webuibash webui.sh -f
2 sh -CNg -L 腹地端口:127.0.0.1:7860 root@云主机地址 -p 端标语
配音:临了,UP 主通过语音合成开源器具包 Coqui-TTS 给故事只作念了一个朗诵旁白。通过 pip 高唱装置,因循包括中语在内的多种说话。用 tts 高唱把 llama3 生成的配图阐扬转谚语音,再同前边生成的视频整合到通盘。
1 pip install TTS
2 tts --text "需要颐养为语音的翰墨实质" --model_name "tts_models/zh-CN/baker/tacotron2-DDC-GST" --out_path speech.wav
最终的效能图UP 主说:「这个演示中,我用的皆是基础模子和默许竖立,寰球不错在此基础上进一步微缓助优化。诚然这几样功能,市面上皆有现成居品不错杀青。但关于学习 AI 的东谈主来说,是要成为 AI 的产生者而不是铺张者,是以照旧得靠我方脱手部署和设立。这种情况下,尤其对学生党来说,云工作的性价比就很高了。假定只须 3000 块的预算,买台带 4090 显卡的电脑就别念念了,但在潞晨云上,4090 的云主机按 2 块钱一小时,平均每天神用 4 小时来算,就能用上 375 天了。何况还能凭证你的需求快速升级和扩容,这点上比我方的电脑还要方便。」
04 结语
跟着潞晨科技的这一翻新设施,咱们正站在一个新期间的门槛上。这是一个由东谈主工智能驱动的创作期间,一个充满无穷可能的智能改日。潞晨科技不仅为咱们掀开了这扇门,更为咱们展示了一个全新的创作宇宙。
*头图起首:视觉中国
本文为极客公园原创著作快播韩国伦理电影,转载请关连极客君微信 geekparkGO