6.1.2 文本和视频结合