动态排版Dynamic Typography：将文字通过动画效果生动呈现的技术

619 0

来自香港科技大学和特拉维夫大学的研究人员推出Dynamic Typography（动态排版），它是一种将文字通过动画效果生动呈现的技术。简单来说，就是让文字动起来，通过变形和运动来表达文字的含义，从而创造出更加生动和有情感的视觉体验。这有点像我们在电影、广告或者网站上看到的文字动画效果，比如一个“跑”字，可能会设计成模拟跑步动作的动画效果。比如对于单词“CAMEL”，可以根据提示“一只骆驼稳稳地穿过沙漠”来设计字母“M”的动画，使其看起来像一只行走的骆驼，同时仍然保持字母“M”的可读性。

项目主页：https://animate-your-word.github.io/demo
GitHub：https://github.com/zliucz/animate-your-word

Dynamic Typography利用矢量图形表示方法和端到端的优化框架。该框架运用神经位移场将字母转换为基本形状，并应用逐帧动画，以确保与预期的文本概念保持一致。同时，开发人员采用形状保持技术和感知损失正则化，以在整个动画过程中保持文字的可读性和结构完整性。开发人员还展示了该方法在各种文本到视频模型中的通用性，并强调了端到端方法相较于单独处理任务的基线方法的优越性。

主要功能：

根据用户的提示，自动地对字母进行变形，以传达语义含义。
将变形后的字母通过动画效果生动地呈现出来，同时保持文字的可读性。

主要特点：

自动化：用户只需要提供简短的文字提示，系统就能自动生成动画。
语义感知：动画效果不仅动起来，而且能够根据文字的含义进行创意性的变形。
保持可读性：即使在动画过程中，文字也能保持清晰易读。
端到端优化：整个动画生成过程是通过一个统一的优化框架来完成的，不需要分开处理变形和动画。

工作原理：

向量图形表示：首先，将每个输入字母和每一帧输出都表示为由一系列贝塞尔曲线组成的封闭形状，这种表示方式是分辨率独立的，保证了文字在不同大小下都能保持清晰。
神经位移场：使用基于坐标的多层感知机（MLP）来表示两个神经位移场，一个用于将原始字母变形为基础形状，另一个用于学习每帧上应用的基础形状的运动。
优化框架：通过端到端的优化框架，结合从预训练的文字到视频模型中提取的运动先验，鼓励动画与预期的文字概念一致。
形状保持技术：在整个动画过程中，通过感知损失正则化和基于三角形化的形状保持正则化，来保持字母的可读性和结构完整性。