无标题
title:DIFFUSIONdate:2025-11-4DIFFUSIONThe sculpture is already complete within the marble block, before I start my work. lt isalready there, I just have to chisel away the superfluous material. - Michelangelo 雕像本来就已经在大理石里面,我只是把不要的部分去掉 Denoise Diffusion Model原理 运作流程: 从高斯分布中采样一张和最终生成图片同样大小的噪声图片 reverse process:通过多次Denoise来去除杂讯,逐步雕刻出最终图片 Denoise Model 输入:除了输入当前含有噪声的图片,还需要输入现在noise严重的程度,根据不同的noise程度做出不同回应 内部结构:存在一个Noise Predicter Noise Predicter:用于预测这张图片中的噪声长什么样 输入含噪声图片和目前噪声严重的程度,输出预测的图片...
无标题
自注意力机制 机制产生的背景:seq2seq的使用场景下,输入和输出的seq的长度不定。 输入向量不确定的情况:输入文字、声音、图片都是一堆向量 1. 文字输入:将一个个单词变为词向量,有两种方式:如果是one-hot encoding无法获取词语在语义上的联系,因此采用word embedding,类别相似的词在距离上更近。 2. 声音输入:例如用25ms的帧作为一个向量,每隔10ms采一个帧。 3. 图(类似于网络图)输入:将每个节点看作是一个向量。 将原子用one-hot向量表示: *** 输出的几种情况:*** 1.每一个输入向量都会有一个对应输出的label:如词性标注、语音和音标转换、社交网络节点属性标注(sequence labeling)。 用于解决这类问题可能首先会想到用全连接层来对每个向量进行连接,并根据每个向量得到一个输出,但是如果全连接层和向量一对一的话,可能会漏掉前后向量间的关系,如对于词性分析任务,I saw a saw这句话中,必须考虑上下文才能判断出两个saw不一样的词性,因此,能够比较容易想到的是将向量和...
Hello World
Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub. Quick StartCreate a new post1$ hexo new "My New Post" More info: Writing Run server1$ hexo server More info: Server Generate static files1$ hexo generate More info: Generating Deploy to remote sites1$ hexo deploy More info: Deployment


