loading

顔認証の開発_太極王技術

自動顔認識の従来のプロセスは、顔検出、顔の特徴点の位置 (顔の位置合わせとも呼ばれます)、特徴抽出、および分類器の設計の 3 つのステップに分かれています。 一般的に狭義の顔認証とは、 & 引用;特徴抽出分類子 & 引用;アルゴリズム研究の 2 つの部分。 ディープラーニングが登場する前は、顔認識方法は一般に、高次元の人工特徴抽出 (LBP、Gabor など) と次元削減の 2 つのステップに分けられていました。 代表的な次元削減手法には、PCA や LDA などの部分空間学習法や、LPP などの一般的な学習法があります。 深層学習手法が普及した後、代表的な手法は、元の画像空間から識別可能な顔表現を直接学習することです。 一般的に言えば、顔認識の研究の歴史は 3 つの段階に分けることができます。 最初の段階 (1950 年代から 1980 年代) では、顔認識は一般的なパターン認識の問題と見なされていました。 主流の技術は、顔の幾何学的構造に基づいていました。 第 2 段階 (1990 年代) では、顔認識が急速に発展し、固有顔、フィッシャー顔、エラスティック グラフ マッチングなど、多くの古典的な手法が登場しました。 現時点では、主流の技術ルートは顔の見かけのモデリングです。 第三段階(1990年代の終わりから現在まで)では、顔認識の研究が深化しています。 研究者は、主に次の 4 つの側面を含む、実際の状況に直面した顔認識に注意を払い始めました。 3D情報について。 2) 照度不変顔認識、姿勢不変顔認識、表情不変顔認識など、顔認識に影響を与える要因を深く分析および研究します。 3) ローカル記述子 (ガボール顔、LBP 顔など) や深層学習手法など、新しい特徴表現が使用されます。 4) ビデオに基づく顔認識、スケッチや近赤外線画像に基づく顔認識など、新しいデータ ソースの使用。 2007 年以降、LFW データベースは実際の条件下での顔認識のテスト ベンチマークになりました。 LFW データセットには、インターネットからの 5749 人の 13233 人の顔画像が含まれており、そのうち 1680 人が 2 つ以上の画像を持っています。 LFW の標準テスト プロトコルには、6000 ペアの顔の 10 倍の確認タスクが含まれます。 各フォールドには、300 対の正の例と 300 対の負の例が含まれます。 性能評価指標として10倍平均精度を採用しています。 LFW のリリース以来、パフォーマンスは常に更新されています。 2013 年以前は、主要な技術的ルートは人工的または学習ベースのローカル記述子測定学習でした。 2014 年以降、主な技術ルートは詳細な学習です。 2014 年以降、ディープラーニング ビッグ データ (大量のラベル付き顔データ) は、顔認識の分野で主流の技術ルートになりました。 2 つの重要な傾向は次のとおりです。1) ネットワークはより大きく、より深くなります (vggface16 層、facenet22 層)。 2) データ量の増加 (deepface 400 万、facenet 2 億) に伴い、ビッグデータは顔認識のパフォーマンスを向上させる鍵となっています。 プレ DL 時代、vipl ラボの第 3 世代とハーフの SDK を例にとると、重要な技術ポイントは、1) ブロックの顔機能の融合: ガボール機能の LPQ 機能です。 2) 特徴削減のための部分空間学習 (PCA LDA)。 3) マルチスケール顔正規化テンプレートの融合。 sdk3.5 の関連技術は、FRGC 実験 4 で 0.1% のエラー許容率の条件下で 96% の確認率を達成しました。これは、FRGC データセットで依然として最高の結果です。 ディープラーニングは特徴学習を重視していますが、特徴学習は DL の特許ではありません。 DL以前の時代には、浅いモデルを用いて画像から直接表現を学習し、人為的な記述子に基づいて意味表現を学習する作業(中位の属性表現を学習するための属性と直喩分類器、高水準の意味表現を学習するためのTom vs Peteなど) ) は、関連する文献に見られます。 2014 年、Facebook は cvpr14 に関する作業を公開しました。 Deepface はビッグデータ (400 万の顔データ) を深い畳み込みネットワークと結合し、LFW データセットで人間の認識精度に近づきました。 Deepface はまた、各空間位置で個別の畳み込みカーネルを学習するために、ローカル接続畳み込み構造を導入します。 欠点は、パラメーターの拡張につながることです。 この構造はその後普及しませんでした。 Deepidファミリーは、DL時代の顔認証分野における代表的な作品群といえます。 初期の Deepid ネットワークには 4 つの畳み込み層が含まれ、softmax 損失関数が採用されていました。 Deepid2 は、deepid2 ネットワークに基づいて ID 損失と検証損失の両方を考慮します。 これら 2 つの損失は、Caffe 深層学習フレームワークでそれぞれ softmaxwithlos レイヤーとコントラスト損失レイヤーを使用することで実現できます。 Deepid2 ネットワークは、deepid2 に基づいて各レイヤーの補助損失関数を追加します (深い教師ありネットワークに似ています)。 Google はその成果を cvpr2015 で公開しました。 Facenet は、22 層の深い畳み込みネットワークと大量の顔データ (800 万人の 2 億枚の画像) と、画像検索タスクで一般的に使用されるトリプル ロス関数を使用します。 顔カテゴリの数が 800 万に達するため、softmax 損失を使用すると、出力層ノードの数は 800 万に達し、少なくとも 32 GB のビデオ メモリが必要になることに注意してください (最後の隠れ層ノードが1024、単精度浮動小数点数を使用) ただし、トリプレット損失は追加のビデオ メモリを占有する必要はありません。 Facenet の LFW データセットの 10% 割引の平均精度は 99.63% に達し、これはこれまでに公式に公開された論文の中で最高の結果であり、2008 年から 2015 年までの 8 年間にわたる LFW のパフォーマンス競争の終わりをほぼ宣言しています。

顔認証の開発_太極王技術 1

私たちと連絡を取ってください
おすすめの記事
ケース
lprパーキングソリューションの紹介人々が理解する必要のある多くのことを書くことになると、いくつかの非常に複雑な問題に目を向ける必要があります
lprパーキングソリューションの導入Lprパーキングシステムは現在、あらゆる種類の自動車や小型トラックに搭載されています。 それらはさまざまな産業に設置されています
lprパーキングソリューションの紹介「lprパーキングソリューションの紹介」というタイトルのブログの段落で、このセクションでは「
lprパーキングソリューションを購入する前に考慮すべき重要な要素は何ですか?私はしばらくの間、オフィス用のパーキング機器を購入しています。 唯一の
lprパーキングソリューションの概要ほとんどの場合、誰かがデバイスで複数のボタンを使用する必要がある場合、最も一般的に使用されるものを使用することを選択します。
lprパーキングソリューションとは何ですか?ほとんどの場合、人々はパーキングシステムで何を探しているのかわかりません。 多くの場合、彼らは同じ場所に駐車し、h
lprパーキングソリューションの導入駐車場とロットマシンは、車の汚れや葉を取り除く唯一の手段です。 ボラードまたはスマートをインストールすることによって
lprパーキングソリューションの導入現代世界の発明は非常に古いものです。 技術と進歩の歴史は長く、多様です。 それはadvaを見ました
lprパーキングソリューションの導入Lprパーキングシステムは、公共交通機関を利用する人々の生活の質を高めるように設計されています。 唯一の問題
lprパーキングソリューションの概要これは、多くの分野で高品質の結果を得るためのよく知られた方法です。 makinの予測方法としても知られています
データなし
Shenzhen Tiger Wong Technology Co., Ltd は、車両インテリジェント パーキング システム、ナンバー プレート認識システム、歩行者アクセス制御回転式改札口、顔認識端末などの主要なアクセス制御ソリューション プロバイダーです。 LPRパーキングソリューション .
データなし
CONTACT US

深センTigerWongテクノロジー株式会社

電話:86 13717037584

メール: info@sztigerwong.com

住所: シリコン バレー パワー デジタル工業団地、ビル A2、1 階、No. 龍華区観蘭街大福路22号

中国広東省深セン  

                    

著作権©2021深センTigerWongテクノロジー株式会社  | サイトマップ
Contact us
skype
whatsapp
messenger
contact customer service
Contact us
skype
whatsapp
messenger
キャンセル
Customer service
detect