https://www.bilibili.com/video/BV1kS4y1s7nC
今天在哔哩哔哩视频看到一个视频, 后半部分 IMF 的介绍我清晰的记得之前在其他视频中看过, 但是却找不到了.
我在想针对这些知识性的视频, 能不能搭建一个洗稿检测平台. 文章的洗稿检测其实很简单, 搜索引擎索引了海量的文章页面. 对于视频, 搜索引擎就无能为力了.
我的一个简单想法是采集哔哩哔哩,YouTube 这两个网站视频的字幕数据,如果没有字幕就需要语音识别. 通过字幕文本来做相似度的检索.
这里面最大的成本应该是如果视频没有提供外挂的字幕, 下载视频的流量以及语音识别需要的算力是不小的开支.
之前在知乎看到过有人使用维权骑士保护文章, 不过刚刚看了一下主页貌似只保护文章.
https://www.rightknights.com/
今天在哔哩哔哩视频看到一个视频, 后半部分 IMF 的介绍我清晰的记得之前在其他视频中看过, 但是却找不到了.
我在想针对这些知识性的视频, 能不能搭建一个洗稿检测平台. 文章的洗稿检测其实很简单, 搜索引擎索引了海量的文章页面. 对于视频, 搜索引擎就无能为力了.
我的一个简单想法是采集哔哩哔哩,YouTube 这两个网站视频的字幕数据,如果没有字幕就需要语音识别. 通过字幕文本来做相似度的检索.
这里面最大的成本应该是如果视频没有提供外挂的字幕, 下载视频的流量以及语音识别需要的算力是不小的开支.
之前在知乎看到过有人使用维权骑士保护文章, 不过刚刚看了一下主页貌似只保护文章.
https://www.rightknights.com/