基于分块DCT的视频文字检测算法

doi:10.3969/j.issn.1007130X.2011.

J4 ›› 2011, Vol. 33 ›› Issue (6): 63-66.doi: 10.3969/j.issn.1007130X.2011.

基于分块DCT的视频文字检测算法

刘凌霞1，牛红惠1，崔洲涓2

（1.安阳师范学院计算机教学部，河南安阳 455000;
2.西安理工大学机械与精密仪器工程学院，陕西西安 710048）

收稿日期:2010-12-01 修回日期:2011-02-26 出版日期:2011-06-25 发布日期:2011-06-25
作者简介:刘凌霞(1977),女,河南安阳人，硕士，讲师，研究方向为图像图形处理和数据挖掘。牛红惠(1972),女,河南濮阳人，硕士,讲师,研究方向为计算机网络、神经网络算法及应用和数据挖掘。崔洲涓(1986),女,河南安阳人，硕士生，研究方向为光通信和FPGA设计。

A Novel DCTBased Video Text Detection Algorithm

LIU Lingxia1，NIU Honghui1，CUI Zhoujuan2

(1.Computer Education Department,Anyang Normal University,Anyang 455000;
2.School of Mechanical and Instrumental Engineering,Xi’an University of Technology,Xi’an 710048,China)

Received:2010-12-01 Revised:2011-02-26 Online:2011-06-25 Published:2011-06-25

摘要/Abstract

摘要：

针对大量视频图像中出现的各种文字信息，本文提出了一种基于离散余弦变换（DCT）的文字提取算法。该方法首先将图像分割为等大小基本块，然后对各小块提取DCT特征。在此基础上，利用图像对比度，设计了一种动态阈值分割方法，可将文字信息和背景信息进行分离。然后依据最小外接矩形算法，获得初始文字检测结果。最终使用Voronoi Diagram算法对初始区域进行合并得到最终文字区域检测结果。算法可以快速而精确定位文字所对应的区域，并且能适用于各种背景条件下的视频图像。

关键词: 视频图像, 文字识别, 检测, 离散余弦变换, 结构分析

Abstract:

To help users navigate the libraries of video, algorithms that automatically index video based on the content are needed. In this paper, we present a DCT based approach to detect texts and captions from the videos. The use of these features is in a flexible manner thus can be adapted to different applications. Language independence is an important advantage of the proposed method. Experiments are conducted on a large volume of real video shots. Solutions are proposed for each of these problems and compared with the existing work found in the literature.

Key words: video;text recognition;detection;DCT;structural analysis

刘凌霞1，牛红惠1，崔洲涓2. 基于分块DCT的视频文字检测算法[J]. J4, 2011, 33(6): 63-66.

LIU Lingxia1，NIU Honghui1，CUI Zhoujuan2. A Novel DCTBased Video Text Detection Algorithm[J]. J4, 2011, 33(6): 63-66.

编辑推荐

Metrics

阅读次数

全文

HTML			PDF

最新录用	在线预览	正式出版	最新录用	在线预览	正式出版
0	0	0	0	0	72

来源	本网站	其他网站

次数	51	21
比例	71%	29%

摘要

最新录用	在线预览	正式出版

0	0	91

	来源	本网站

	次数	91
	比例	100%

[1]	武培成, 赵旭俊, 靳黎忠. 基于网格密度积叠的流数据异常检测[J]. 计算机工程与科学, 2025, 47(01): 75-85.
[2]	陈兆波, 张琳, 马晓轩. 改进注意力混合自动编码器视频异常检测研究[J]. 计算机工程与科学, 2025, 47(01): 130-139.
[3]	沈凡凡, 汤星译, 张军, 徐超, 陈勇, 何炎祥. 基于改进萤火虫算法和长短期记忆网络的恶意行为检测方法[J]. 计算机工程与科学, 2024, 46(12): 2158-2170.
[4]	刘沛, 刘昌华, 林俏伶. 基于优化特征堆叠与集成学习的车联网入侵检测模型[J]. 计算机工程与科学, 2024, 46(12): 2186-2195.
[5]	徐淑萍, 卫浩波, 孙洋洋, 万亚娟. 基于模板更新和重检测的长时目标跟踪研究[J]. 计算机工程与科学, 2024, 46(12): 2196-2204.
[6]	马金林, 闫琦, 马自萍. 西夏文字的多层掩码识别方法[J]. 计算机工程与科学, 2024, 46(12): 2227-2238.
[7]	马心宇, 李彤, 曹景堃, 吴波, 孙永谦, 赵乙. 基于QoS-QoE预测的传输瓶颈定位[J]. 计算机工程与科学, 2024, 46(11): 1989-1996.
[8]	戴康佳, 徐慧英, 朱信忠, 黄晓, 李琛, 刘巍, 曹雨淇, 王拔龙, 刘子洋, 陈国强. 基于轻量化目标检测网络的RGB-D视觉SLAM系统[J]. 计算机工程与科学, 2024, 46(11): 2017-2026.
[9]	郭兴君, 李晓红, 史婉媱, 高文超. 融合模体感知和图Transformer编码的社区检测[J]. 计算机工程与科学, 2024, 46(11): 2081-2090.
[10]	李公瑾, 邵玉斌, 杜庆治, 龙华, 马迪南 . 基于双向胶囊网络的恶意评论检测[J]. 计算机工程与科学, 2024, 46(10): 1765-1774.
[11]	陈子雄, 陈旭, 景永俊, 宋吉飞. 基于图神经网络的源代码漏洞检测研究综述[J]. 计算机工程与科学, 2024, 46(10): 1775-1792.
[12]	陈昌奉, 赵宏州, 周恺卿. 基于图神经网络的代码抄袭检测方法[J]. 计算机工程与科学, 2024, 46(10): 1815-1824.
[13]	曹雨淇, 徐慧英, 朱信忠, 黄晓, 陈晨, 周思瑜, 盛轲. 基于YOLOv8改进的打架斗殴行为识别算法：EFD-YOLO[J]. 计算机工程与科学, 2024, 46(10): 1825-1834.
[14]	余佳妮, 胡朝霞, 蒋从锋. 一种基于多特征的日志事件异常检测方法研究[J]. 计算机工程与科学, 2024, 46(09): 1587-1597.
[15]	潘雨青, 于浩, 李峰. 基于加权非负矩阵分解的异常声音检测方法研究[J]. 计算机工程与科学, 2024, 46(08): 1425-1432.

基于分块DCT的视频文字检测算法

A Novel DCTBased Video Text Detection Algorithm

PDF

可视化

摘要/Abstract

引用本文

使用本文

相关文章 15

编辑推荐

Metrics

本文评价