完整的视频处理流程,分三步执行:
步骤 1 + 2 - 截图并自动 OCR
bash
source .venv/bin/activate && python pipeline.py process --save-dir output/captures --interval 500
告知用户:
- •点击 "Select Area" 选择屏幕上的视频区域
- •点击 "Start Capture" 开始定时截图
- •播放视频
- •截图会在停止后自动结束(无新截图超过 interval*2 时自动停止),然后自动运行 OCR
等待命令执行完毕。
步骤 3 - 生成文章
读取 output/extracted_text.txt,将零散的 OCR 文字整理成一篇通顺的 Markdown 文章:
- •去除 OCR 噪音(乱码、非视频内容的 UI 文字等)
- •去除重复和无意义的内容
- •按逻辑组织段落
- •语言通顺,保留原意
将最终文章写入 output/article.md 文件,并告知用户文件路径。