2023年,我们看到了扩散模型推理速度方面的一些重大理论改进,例如Song等人的原始一致性模型论文,以及最近的LCM。(另外,对抗扩散蒸馏。)我们已经开始看到使用这些想法的项目,例如Dan Wood的Art Spew(每秒77512×512图像,在单个4090上)、Modal的Turbo.art(基于SDXL Turbo) 和fal.ai的30fps脸部交换。
DeWave的训练流程主要分为三个阶段:1)自监督编码器预训练(仅原始EEG脑磁波),这一阶段会先训练一个脑电波自编码模型,输入原始EEG波形,通过重建实现自监督。这样可以提取有用的时域和频域特征。
使用v0构建的任何内容都需要进行大量修改,否则最终看起来像是业余产品。我赞扬这个努力,但UI设计是复杂且动态的。我们还没有到AI能够始终产生一流UI设计的地步,但它为你的UI提供了一个起点。
我们大概就领先几个月,然后这个平台就公开,但是我们会开发更好的。
**本文概要:**