美图GO1

 找回密碼
 立即註冊
搜索
熱搜: 活動 交友 discuz
查看: 13|回復: 0

第二步:搜索电视节目

[複製鏈接]

1

主題

1

帖子

5

積分

新手上路

Rank: 1

積分
5
發表於 2025-11-25 14:44:51 | 顯示全部樓層 |閱讀模式
当你想在视频中查找特定片段时,视频就非常糟糕。它速度慢、文件大,更适合观看而不是处理,但有时你不得不找到一种方法。

您可以尝试以下几种方法。其中之一是转录;如果您有带时间码的转录文本,您可以做任何事情。例如,您可以创建一个视频文本编辑器,或者搜索关键词,例如“我同意这条消息”。

问题在于,大多数电视节目并没有精确转录。美国大多数电视节目都要求配有隐藏式字幕,但广告却不需要。令人震惊的是,大多数政治广告都没有字幕。虽然市面上有一些开源的自动转录工具,但效果却差强人意。

音频指纹识别技术简介

我们使用名为audfprint的免费开源工具  将音频文件转换为音频指纹。

音频指纹是音频文件的精简版本,它只保留了每隔几毫秒最“有趣”的部分。诀窍在于,这些精简片段的 WS 数据库 生成方式便于比较,而且由于是精简版,生成的指纹文件比原始文件小得多,处理起来也更快捷。

我们使用的音频指纹基于一种叫做频率的特性。声音由波组成,每个波以不同的频率重复(振荡)。重复频率越高,声音越高;重复频率越低,声音越低。

音频文件包含指示计算机如何生成这些波形的指令。Audfprint 将音频文件分割成微小的片段(每秒约 20 个片段),并对每个片段运行数学函数,以识别最显著的波形及其对应的频率。



其余部分被丢弃摘要被存储最终得到音频指纹

如果两个文件中存在相同的声音,则它们的指纹中会显示一组共同的主导频率。Audfprint 可以比较两个音频文件中的片段,统计它们共有的片段数量,以及大致位于相同距离的片段数量。

我们用这个工具来查找政治广告的副本。

步骤三对政治广告进行分类

当我们发现新的政治广告时,首先会将其注册到互联网档案馆,启动收录流程。发现广告的人会输入一些基本信息,例如广告中提及的人物、广告的付费方以及讨论的主题。

然后,广告会被发送到我们构建的用于管理指纹识别工作流程的系统,我们戏称它为 Duplitron 5000,或者简称“DT5k”。该系统使用 audfprint 生成指纹,组织指纹的存储方式,处理比对结果,并使我们能够扩展到处理数百万分钟的电视节目。

DT5k 会为广告生成一个指纹,将其存储起来,然后将该指纹与系统中先前已导入的数十万个节目的现有指纹进行比对。所有结果需要几个小时才能全部返回。结果返回后,Duplitron 会分析这些数据,并将结果告知存档系统哪些节目包含该广告的副本以及该广告的播出时间。

这些结果最终相当准确,但并非完美无缺。匹配是基于音频而非视频,这意味着当政治广告和例如电视购物广告中使用了相同的配乐时,我们会遇到问题。


本帖子中包含更多資源

您需要 登錄 才可以下載或查看,沒有帳號?立即註冊

x
您需要登錄後才可以回帖 登錄 | 立即註冊

本版積分規則

親愛的,趕快加入我們吧!
X

Archiver|手機版|自動贊助|MEITU GO1 BBS |申請友情鏈接

GMT+8, 2026-3-2 10:12 , Processed in 0.048885 second(s), 27 queries .

抗攻擊 by GameHost X3.4

© 2001-2017 Comsenz Inc.

快速回復 返回頂部 返回列表
一粒米 | 中興米 | 論壇美工 | 設計 抗ddos | 天堂私服 | ddos | ddos | 防ddos | 防禦ddos | 防ddos主機 | 天堂美工 | 設計 防ddos主機 | 抗ddos主機 | 抗ddos | 抗ddos主機 | 抗攻擊論壇 | 天堂自動贊助 | 免費論壇 | 天堂私服 | 天堂123 | 台南清潔 | 天堂 | 天堂私服 | 免費論壇申請 | 抗ddos | 虛擬主機 | 實體主機 | vps | 網域註冊 | 抗攻擊遊戲主機 | ddos |