多くのスマートフォンのナンバープレート認識システムの名刺スキャンソフトウェアは、この機能を持っています。 2018年11月20日、光学式文字認識 (以下、OCR) とは、画像を分析してテキスト情報を取得するプロセスを指します。 OCRの分野における重要な指標である国際文書分析および認識会議 (ICDAR) のテストセットが再び更新されました。 中国の大学と企業がICDAR 2015でトップ5にランクインし、続いてピクセルアンカー南京大学と南京工科大学 (psenet masktext、fot) アリババ (inceptext) はテキスト認識とアプリケーションに重点を置いています。 自然シーンのテキスト検出と認識のレベルを向上させるために、文書分析と認識に関する国際会議は、国際パターン認識協会 (IAPR) が主催する専門会議の1つです。 文書分析と認識に関する国際会議 (ICDARは2003年に強力なテキスト読書コンテストを設立しました (robustradecompetitionはこれまでに89か国から3500以上のチームが参加しました。
Google microsoftamazon Facebook、北京大学、中国科学技術大学、Tencent、Sogouなど それに参加しました。 結果はいつでも提出でき、強力なテキスト読書競争のテストデータセットがオンラインで公開されています。 自然なシーンのテキスト検出業界におけるテストアルゴリズムのテストデータセット。 ICDAR2015とicdar2017mltは2つのテストサブセットです。 Cdar2015とicdar2017mltは、自然シーンのテキスト検出の分野で信頼できるデータセットです。急増するニュースは、現在icdar2015リストで1位にランクされているクラウドコンテクノロジーにインタビューしました。 科学技術研究所のアルゴリズムエンジニアであるLiYuanが紹介しました。 基本的に、すべての記事がその上で検出されます」はランキングの基礎でもあります。 Cdar2015リスト (2018年11月20日) Fの値は、精度と検出率の調和平均を表します。 Fの値が大きいほど、検出結果は良好である。
Precisionは、検出結果における正しいテキストの割合を表します。検出率 (リカルは、検出されたテキストと画像テキストの総数との比率を反映しており、レポーターのリストを説明しています。 テキストを見逃したかどうかを反映できます。 アルゴリズムの効果を検出するためには、ナンバープレート認識システムは精度と検出率を包括的に考慮する必要があり、F値は精度と検出率の調和平均を表すだけであり、ランキングの基礎でもあります。 前者にはテキストを認識する機能がないため、注意が必要です。ここで述べた自然なシーンのテキスト検出は、テキスト認識と同等ではないことを意味します。 それは写真のテキストを検出することを意味します。
2018年11月20日、LiYuanは言った。 Yuncongテクノロジーは、自然なシーンのテキスト検出のためのピクセルアンカーフレームワークを提案したプレプリントWebサイトarXivで最新の紙の効果を公開しました。 論文が発表される前に、文書の分析と認識に関する国際会議によってリリースされました。ピクセルアンカーアルゴリズムはicdar2015とicdar2017mltデータセットでテストされ、icdar2015の最良の結果が更新されました。 Icdar2015純粋な英語のテキスト検出データセットが報告されています。 Icdar2017mltには、ラテン語、英語、中国語、韓国語、日本語、アラビア語などの9つの言語が含まれています。 Yuncongのピクセルアンカーアルゴリズムは、icdar2017mltの包括的なリストで4位にランクされており、上位3か国外国の機関から公開論文は提出されていません。
自然シーンのテキスト検出はより広い分野に適用できますが、従来のテキスト検出、さまざまな商品でのOCRテキスト検出と認識、自然シーンのセットまたは自然シーンの写真と比較して、複雑な背景干渉、テキストのぼかしと劣化、予測不可能な照明、フォントの多様性、垂直テキストと傾斜テキストナンバープレート認識システムは、写真分析、ナンバープレート認識、画像広告フィルタリング、シーン理解、商品認識、ストリートビュー位置、請求書認識などの高品質のドキュメント画像の保守的なOCRと比較されます。
深センTigerWongテクノロジー株式会社
電話:86 13717037584
メール: info@sztigerwong.com
住所: シリコン バレー パワー デジタル工業団地、ビル A2、1 階、No. 龍華区観蘭街大福路22号
中国広東省深セン