cs131 lecture 1 Introduction

課程介紹 CS131 是史丹佛大學所開設的電腦視覺課程 主要預備技能與知識有 Python 應用 線性代數 微積分 機率與統計 有了以上的基礎知識,在接下來的課程會比較得心應手 而除了 CS131 在史丹佛有電腦視覺課程外,另外還有進階課程 CS231a、到 DNN 領域的 CS231n 讓想更進一步學習的人有更多選擇 Introduction to Computer Vision 人之所以看得到影像,是由於光線照到物體,經由眼睛接收到影像,再傳送到大腦做對應的舉動 ex:騎車看到紅燈會停車、看到貓咪會想用手去摸… 而電腦視覺所做的事也是如此,用一個攝影機接收影像資訊,傳送到電腦,經過計算後進行相應的舉動 電腦視覺與人眼的動作流程差異: 打光到物體成像 -> 接受影像(人眼\sensor) -> 理解(大腦\電腦) 並做出動作 而人眼的視覺感知是非常強的,對物體分析、幾何認知能力在電腦視覺上都很難去做 但偶爾也有出錯(被騙)的時候,人眼視覺錯覺: 棋盤陰影錯覺 電腦視覺的挑戰:將數位影像像素值轉換成有用的訊息 人眼看到的與電腦視覺看到的東西是截然不同的 如何建構一個方法(演算法)可以像人眼一樣識別幾何、分析物體、由影像取出我們想知道的資訊。 電腦視覺應用 3D 建模 臉部辨識:臉部偵測、笑臉檢測 生物辨識:指紋辨識、虹膜辨識、人臉解鎖 文字辨識 OCR 影像分類:手機上執行物品搜尋器-Google Googles、商品搜尋功能 app-snapTell 自駕車 智慧超市

February 8, 2021 · 1 min · yanz

Canny Edge Detector

Canny edge檢測流程 使用高斯濾波器 使用Sobel濾波器取出x,y方向梯度 對梯度進行非極大值抑制 使用滯後閾值 高斯濾波 平滑影像,濾除雜訊 滯後閾值 設定高閾值與低閾值 低於低閾值的不是edge,如線段(D) 高於高閾值的是強edge,如線段(A)、(B) 介於高低閾值之間的edge,需檢查他的線段是否有與強edge連接 若有連接到,如線段(C),就視為edge,沒連接到的就非edge(E)

December 15, 2020 · 1 min · Yen Tsai

Canny Edge Detector

Canny edge檢測流程 使用高斯濾波器 使用Sobel濾波器取出x,y方向梯度 對梯度進行非極大值抑制 使用滯後閾值 高斯濾波 平滑影像,濾除雜訊 滯後閾值 設定高閾值與低閾值

December 15, 2020 · 1 min · Yen Tsai

Image Classification

website:CS231n: Convolutional Neural Networks for Visual Recognition 影像分類是電腦視覺的核心任務,但其中有許多障礙要克服 遇到的問題 Semantic Gap 語義鴻溝 Semantic Gap指的是在不同系統中形成的結構造成差異 人眼傳送到大腦所看到的物體形成的過程!=攝影機傳送到電腦看到物體形成的過程 人眼看到的是物體是光線照射到物體,經過反射後部份光線射入我們的眼睛。人腦所想的通常是高階特徵ex:飛機、汽車、室內空間 在電腦中看到的數位影像是個三維tensor(R, G, B channel)。電腦主要觀察低階特徵ex:顏色分布、紋理(texture) Viewpoint variation 視野角度變化 攝影機視野改變造成觀測結果產生變化 Background Clutter 非均值的背景 背景可能非常雜亂 Illumination 亮度的變化 不同的燈源,打光方式造成同一個物體不同成像結果 Occlusion 被遮蔽的物體 物體被遮擋一部分,但還是可以透過特徵來辨認出來 Deformation 物體形狀的變化 Intraclass variation 同類型的不同變化 沒辦法透過硬編碼的方式在這些問題下輕易的分類出貓咪 機器學習: 數據驅動方法 寫一個影像分類演算法與排序演算法非常不同,假設今天是要辨識一隻貓咪,我們必須考慮到貓咪的各種形狀、顏色等變化。 因此,與其透過硬編碼方式定義出複雜的經驗法則,不如透過給予很多數據來建立一個學習演算法。 流程: 收集數據集(影像與對應的類別標記) 機器學習演算法訓練分類器 使用分類器預測新讀進來的影像 Nearest Neighbor Classifier Nearest Neighbor 比較兩影像之間的距離 L1距離公式:$d_1(I_1, I_2) = \sum_{p} |I^P_1 - I^P_2|$ $其中I_1, I_2 是影像,P是I_1, I_2像素點的索引$ 這個距離公式就是逐點計算兩影像像素值差異的總和,加絕對值是為了避免正負號誤差加總後造成抵銷 實作KNN測試cifar10 in github 參考 跟着cs231n学英语(Module 1)

November 15, 2020 · 1 min · Yen Tsai