按域名瀏覽

卷積神經網絡模型架構和應用如何改善我們的日常生活

目錄

您是否經常想知道CNN架構在做什麼?隨機層是如何堆疊的,如此龐大的架構是如何設計的?在我們進入案例研究之前,我們將了解一些CNN架構,同時,為了了解神經網絡的學習方式,我們將討論各種神經網絡。因此,讓我們涵蓋各種計算機視覺模型架構,網絡類型,然後看看這些應用程序如何用於提高我們的日常生活。


模型架構
已經提出了許多CNN架構,我們可以在模型動物園中找到關於這些研究論文的更多信息,這些模型動物園與實現相同的模型動物園一起存在。例如,Keras有一個模型動物園,其中可以找到所有的模型權重。讓我們學習一些主要的架構,如AlexNet, Inception, ResNet。
閱讀所有關於這裏是人工智能。
可用的各種流行模型體係結構是什麼?

  1. AlexNet
  2. GoogLeNet
  3. VGGNet
  4. ResNet

AlexNet

  • AlexNet是由監督小組創建的傑作,其中包括來自多倫多大學的主創Alex Krizhevsky, Geoffrey Hinton和Ilya Sutskever。
  • ImageNet-2012的獲勝者AlexNet展示了這一點深度學習是實現最低錯誤率的方法。

了解模式識別的工作原理。

AlexaNet卷積神經網絡



AlexNet的架構是什麼?

  • AlexNet的主要特點是它重疊了池化操作,以減少網絡的規模。
  • AlexNet有五個卷積層和三個全連接層,在每個卷積層和全連接層之後應用ReLu函數,向我們展示了在圖像分類中實現最先進結果的方法。
  • 它使用ReLu作為激活函數,加快了訓練速度,提高了準確率。它使用的正則化技術是一個dropout。接下來,我們將考慮Inception體係結構。想知道架構之間的區別是什麼嗎?讓我們來分析Inception架構的架構設計方法。

GoogLeNet / Inception(2014)是如何設計的?

  • 也被稱為inception模型,因為架構中存在inception模塊(源自電影inception), GoogLeNet贏得了2014年的ImageNet。
  • 該網絡使用的CNN的靈感來自LeNet。它的體係結構包括網絡中間的1×1卷積。它使用全局平均池來代替全連接層。
  • 各種技術,如批處理歸一化、圖像失真和RMSprop用於提高精度。

VGGNet (2014)

  • VGGNet是由牛津大學的VGG(視覺幾何組)創建的。它是ImageNet -2014挑戰賽的亞軍。
  • 它主要用作特征提取算法。通過許多濾波器,它可以作為用於目標檢測的單發探測器的基礎模型。

ResNet (2015)

  • ResNet贏得了ILSVRC 2015。這是第一個精度超過人類水平的模型。它是最深的網絡,有152層。
  • 該模型的新穎之處在於它引入了跳躍式連接,並具有重批歸一化的特點。

ResNet的優勢是什麼?

  • ResNet將梯度消失問題減小到最小。當權重的變化如此之低,以至於錯誤不會在深度學習模型中存在的大量層中反向傳播時,就會出現消失的梯度。
不同類型的神經網絡

現在我們已經了解了各種模型架構,建議通過閱讀論文來更好地理解相同的內容。讓我們轉向各種類型的神經網絡。我們將涵蓋循環神經網絡(RNNs),長短期記憶(LSTMs),然後看看應用。

神經網絡有哪些不同的類型

  1. 卷積神經網絡
  2. 循環神經網絡
  3. LSTMs
  4. 門控-循環單元

為什麼使用循環神經網絡(RNN)?

  • cnn不擅長對順序信息建模。因此,該問題的解決方案是提出一個對順序模式建模的網絡。
  • rnn解決了上述問題,它執行相同任務的方式是引入一個反饋元素,該元素將一係列中前一個數據的輸出作為下一個輸入。
  • 這讓網絡學習當前數據點和之前數據點之間的相關性。
  • 加上幾個循環單元,我們就可以了解到序列數據中許多數據點之間的相關性。有這麼多支持rnn的觀點,還有人反對它嗎?接下來我們將揭曉答案。

rnn的缺點是什麼?

  • 雖然這在理論上是可行的,但rnn會遇到梯度消失的問題,因為我們經常會隨著循環單元數量的增加而丟失順序信息。因此,lstm是建議的解決方案。

長短期記憶(LSTM)
長短期記憶(LSTM)可以在更長的時間內存儲大量的數據點,因此,它可以很好地捕獲長期效率。
lstm有幾個門。它們是什麼?

  1. 忘記門,
  2. 輸入門
  3. 輸出門。

LSTM神經元是如何工作的?
遺忘門的作用是維護以前狀態的信息。輸入門通過在輸入的幫助下更新當前狀態來工作。輸出門決定有多少信息需要傳遞到下一個狀態。因此,它巧妙地吸收了遺忘和保持選擇性模式的特性,從而使它能夠在更長的時間內保持信息。
應用程序
讓我們進入深度學習最令人興奮的方麵,它的應用。考慮分類、檢測、定位、分割和圖像字幕等應用程序是我們在這裏的關鍵興趣。如今,計算機視覺已經使智能家居、智能超市、智能購物成為可能,並使智能手機成為一個巨大的革命性平台。可以在智能手機上運行的更小、更高效的型號也實現了同樣的目標。
我們從哪裏獲得商業/實時應用程序的數據?
我們可以通過幾種方式為應用程序捕獲數據,

  1. 閉路電視錄像
  2. 無人駕駛飛機
  3. 手機
  4. 傳感器
計算機視覺應用

這些捕捉設備就像一個捕捉信息的傳感器。信息通過雲、無線網絡或在本地處理器上處理傳給模型。讓我們更詳細地看看這些應用程序。

你能說出計算機視覺的一些應用嗎?

  1. 分類:圖像分類用於標識圖像所屬的類別。如果結果還涉及到我們將圖像分類為某一類的置信度,則執行任務的效果會更好。在下一篇教程中,我們將研究在food-101數據集上實現的圖像分類模型的實現。它有各種各樣的用途。本質上,我們的想象力是極限。例如,識別一個放在公共場所無人看管的包是否有害就是一個不同尋常的例子。我們還可以使用圖像分類模型進行圖像檢索,這是搜索引擎最常用的。給定一個關鍵字,識別最相關的圖像集合,然後檢索相似的圖像以顯示在搜索頁麵上。
  2. 對象檢測/本地化:分類對圖像進行分類,但不討論圖像的哪一部分屬於該類。因此,對象檢測是一項任務,它可以找到感興趣的對象在圖像中的位置,並輸出帶有邊界框的對象。這在涉及到了解物體的相對距離和方向的應用程序中很有用。例如,在自動駕駛汽車中,了解行人或任何其他物體的位置有助於做出更安全的決策。用於衡量目標檢測算法性能的度量是IOU(交集勝過聯合)。
  3. 市場細分:檢測處理的是生成邊界框。分割通過考慮像素分類來解決不同的問題。這提供了關於對象邊界等更精細細節的信息,因此輸出的信息越精細越好。它對處理醫學圖像和衛星圖像很有用。

了解深度學習如何為計算機視覺提供動力。

還有更多的應用,如相似學習,圖像字幕,生成模型,視頻分析等。

  1. 相似的學習:相似學習是對圖像之間相似性的理解。我們可以根據上下文、語義理解,或者僅僅是相互重疊的模式的數量來確定相似性。所以下次你在穀歌上搜索圖片時,相似學習的背景會幫助你快速找到相似的圖片。
  2. 圖片標題:圖像標題用於為圖像生成標題。它在對象分類模型和lstm的幫助下生成標題。lstm幫助建模圖像和與之相關的標題之間的順序信息。它是一個處理計算機視覺和自然語言處理的應用程序。圖像字幕的使用是為了了解給定圖像中一個主體與另一個主體的相對位置。這裏我們展示一個DenseCap的例子。
  3. 生成模型:生成模型處理訓練網絡,根據它們的理解或學習生成圖像。例如,在訓練階段,如果數據集是人臉數據集,生成模型會學習構成人臉的特征。因此,在了解了人臉的特征之後,它可以生成新的人臉。同樣的一個有趣的應用是名人麵孔的生成。同樣的應用在深度學習模型的訓練領域。由於這些模型需要大量數據,因此收集大量數據是一項繁瑣的任務。相反,根據我們的需要生成數據是相應地訓練模型的更好選擇。
  4. 視頻分析:假設我們進入一家購物中心,基於我們在購物中心的活動,我們的個性化助理會推薦我們可能感興趣的產品。視頻分析處理交付實時結果,並提出增強應用程序的模式、結論和結果。例如,對板球、足球等體育賽事的分析可以自動化。球員的位置,實時統計數據,以及擊敗最強球隊的最佳方法都是一些例子。

在這篇文章中,我們討論了很多主題,包括模型架構、神經網絡類型和計算機視覺領域的應用。由於這一領域的進步,將受到影響的主要行業是製造業、汽車行業、醫療保健和農業。有效地實現這些算法和更好的應用程序是解決手頭最具挑戰性的問題的需要。所有的資源都可以在網上免費獲得。因此,我們鼓勵您構建能夠真正改變世界的應用程序和產品。

《阿凡達》的照片
beplay2018官网優秀的學習團隊
beplay2018官网Great Learning的博客涵蓋了最新的技術發展和創新,可以用來建立有價值的職業生涯。你會找到職業指南、技術教程和行業新聞,讓自己跟上快速變化的技術和商業世界。

關於“卷積神經網絡模型架構和應用如何改善我們的日常生活”的1個想法

留下評論

你的電郵地址將不會公布。必填字段已標記

    目錄

與夢想的工作免費的印度最值得信賴的教育平台上的證書課程

滾動到頂部
Baidu
map