KompüterInformasiya texnologiyaları

Modern kompüter görmə. Tapşırıqlar və kompüter görmə texnologiya. Python Programming Computer Vision

Necə şəkil və ya şəkil təsvir nə anlamaq üçün bir kompüter öyrətmək üçün necə? Bu sadə görünür, lakin bir kompüter üçün bu adet sıfır və mühüm məlumat çıxarış istədiyiniz olanları ibarət yalnız bir matrix edir.

kompüter görmə nədir? Bu kompüter "görmək" üçün bacarığıdır

Vision - istifadə şəxs üçün məlumat mühüm mənbəyidir, biz 70 olan məlumatların 90%, müxtəlif hesablamalara görə, almaq. bir smart avtomobil yaratmaq istəyirsinizsə, əlbəttə, biz eyni bacarıq və kompüter həyata keçirmək lazımdır.

kompüter görmə problemi kifayət qədər aydın ifadə oluna bilər. "Görmək" nədir? Bu baxaraq yalnız olduğu başa düşülür. Bu kompüter görmə və insan görmə fərqlər başa çatıb. bizim üçün Vision - Bu dünya haqqında bilik mənbəyi, eləcə də metrik informasiya mənbəyidir - ki, imkanı məsafələr və ölçüləri anlamaq üçün.

Semantik kernel image

şəkil baxaraq, biz semantik məlumat çıxarış, belə ki, danışmaq, atributları bir sıra ilə təsvir edə bilərsiniz.

Məsələn, bu şəkil baxaraq, biz açıq havada demək olar ki. şəhər yol nədir. Bu maşın var. bu bina və hiyeroglif konfiqurasiya Cənub-Şərqi Asiya ki, tahmin edə bilərsiniz. Mao Zedong portreti bu Pekin başa düşürük ki, və hər kəs canlı video gördüm və ya özü var idi, bu məşhur Tiananmen Square olduğunu təxmin edirəm.

Biz bunu görən, şəkil haqqında daha çox deyə bilərsiniz? hasar - Biz insanlar burada yaxın var ki, demək, şəkil obyektlərin müəyyən edə bilər. Burada çətir ki, binanın plakatlar. Bu sinif nümunələri an üçün axtarış ilə məşğul olan çox əhəmiyyətli obyektlərin, edir.

Hələ biz xüsusiyyətləri və ya obyektlərin atributları bəzi öyrənə bilərsiniz. Məsələn, burada bu yəni adi Çin, Mao Zedong bir portret deyil ki, müəyyən edə bilər.

avtomobilin görə bir hərəkət obyekt olduğunu müəyyən, və bu hərəkət zamanı deformasiya deyil ki, çətin ola bilər. bayraqları bu obyektlərin demək olar ki, haqqında, onlar da hərəkət edir, lakin onlar çətin daim deformasiya deyil. Və səhnə var bayraqları inkişaf müəyyən edilə bilər külək, və hətta külək istiqaməti, məsələn, soldan sağa əsən müəyyən edə bilər.

kompüter görmə məsafələr və uzunluğu

Çox əhəmiyyətli kompüter görmə elm metrik məlumat. Bu məsafələr hər cür deyil. qrupları Earth təxminən 20 dəqiqə və daha çox cavab, çünki Məsələn, rover üçün xüsusilə vacibdir. Buna görə, orada və geri link - 40 dəqiqə. biz Earth hərəkət əmrləri üçün bir plan varsa, siz nəzərə almaq lazımdır.

Uğurla video oyun kompüter görmə texnologiya inteqrasiya. video görə, obyektlərin, insanların üç ölçülü modellər inşa edə bilərsiniz, və istifadəçi photos şəhərlərin üçölçülü modelləri bərpa edə bilərsiniz. Və sonra onlara gəzmək.

kompüter görmə - Bir daha geniş. Bu sıx müxtəlif elmləri ilə iç-içə. kompüter görmə hissəsi Bu görüntü emal sahəsi edər və bəzən tarixən, kompüter görmə ayırır.

Təhlili, model tanınması - üstün kəşfiyyat yaradılmasına yol

Bizə ayrı-ayrılıqda bu anlayışlar nəzərdən keçirək.

Image Qenerasiya - image, və biz ona bir şey var - bu giriş və çıxış edən alqoritmlər bir sahədir.

image analiz - iki ölçülü görüntü ilə iş və bu nəticələr etmək yönəlmişdir kompüter görmə, sahəsi.

Pattern Recognition - istiqamətini şəklində data tanıyır mücərrəd riyazi intizam. Bu giriş-də edir - vektor və biz onunla bir şey var. vektor harada bilirik belə əhəmiyyətli deyil.

Kompüter görmə - bu ilk iki ölçülü şəkillər strukturu bərpa etmək idi. Bu gün bu sahə geniş olmuşdur və bu image əsasında edilməsi fiziki obyektlərin bütün qəbul kimi təfsir edilə bilməz. Ki, bu vəzifə süni intellekt.

tam fərqli bir sahəsində kompüter görmə ilə paralel olaraq, geodeziya, Fotogrametri inkişaf etmişdir - obyektlər arasında məsafə bir ölçü iki ölçülü şəkillər.

Robotlar "görürəm" olar

Və nəhayət - Bu maşın görmə edir. maşın görmə altında robotlar bir görmə deməkdir. Ki, bəzi istehsal problemləri qərardır. böyük bir elm deyil - biz ki, kompüter görmə demək olar. Bu, digər elm hissəsi bəzi birləşdirir. kompüter görmə hər hansı bir proqram olur zaman, bir maşın görmə çevrilir.

Kompüter görmə rayon praktiki applications kütləvi var. Bu istehsalın avtomatlaşdırılması ilə bağlıdır. müəssisələrində maşın ilə əl əməyi əvəz daha səmərəli olur. maşın o nizamsız iş qrafiki var idi, yuxu deyil, yorğun almaq deyil, o, bir il 365 gün işləmək istəyir. Belə ki, maşın iş istifadə edərək, müəyyən bir zamanda təmin nəticə əldə edə bilərsiniz, və bu, olduqca maraqlı. Bütün vəzifələri kompüter görmə sistemləri üçün aydın istifadə. Və yalnız hesablanması mərhələsində şəkil dərhal nəticələri görmək üçün daha yaxşı bir şey yoxdur.

süni intellekt dünyanın ərəfəsində

Plus sahəsi - çətindir! görmə məsul beyin əhəmiyyətli hissəsi və bu öyrətmək əgər sizin kompüter ki, tam istifadə kompüter görmə, tam süni intellekt məqsədlərindən biridir, "görmək" üçün inanılır. insan səviyyədə problemi həll edə bilər, eyni zamanda çox güman ki, biz AI problemi həll edəcək. Bu, çox yaxşı! Və ya çox yaxşı deyil, siz baxmaq əgər, "Terminator 2".

Niyə görmə - bu çətindir? eyni obyektin image dəyişə bilər, çünki çox xarici amillərdən asılı olaraq. müşahidə bal obyekt asılı olaraq müxtəlif baxmaq.

Məsələn, bir və eyni rəqəm, müxtəlif açılardan alındı. Və bir göz, iki gözü yarım ola bilər rəqəm ən maraqlı edir. Və məzmunundan asılı olaraq (boyalı gözləri ilə bir köynək insan bu image varsa), göz daha iki ola bilər.

kompüter hələ dərk etmir, lakin "görür"

çətinləşdirir digər amil - bu işıqlandırma var. müxtəlif işıqlandırma ilə eyni səhnə müxtəlif görünür. obyekt ölçüsü dəyişə bilər. hər növ Bundan əlavə, obyektləri. 2 metr ki, onun hündürlüyü bir insan haqqında nə deyə bilərsiniz? Heç bir şey. İnsan artım və 2.3 m, və 80 sm ola bilər. Obyektlərinin digər növləri kimi, lakin, eyni sinifdə obyektləri.

Xüsusilə yaşayış obyektləri suşlarının bir sıra keçirlər. Hair insanlar, idmançılar, heyvanlar. onların yal ilə baş və quyruq sadəcə mümkün deyil nə müəyyən çalışan atlar şəkillər baxın. bir şəkil bir üst-üstə obyektlərin? Bir kompüter şəkil, hətta ən güclü maşın itələmək Əgər doğru qərarı vermək üçün çətinlik.

Next view - bir maskalamaq var. Bəzi obyektlərin, heyvanlar olduqca məharətlə mühit kimi Masquerading, və. Və eyni ləkələr və boyayıcı. Buna baxmayaraq, biz həmişə baxmayaraq uzaqdan, onları görmək.

Başqa bir problem - hərəkət. unimaginable hərəkət obyektləri deformasiya məruz.

obyektlərin çoxu çox dəyişir. Burada, məsələn, "kafedrasının" obyektləri aşağıdakı iki photos.

Bu siz oturmaq bilər. Lakin forma, rəng, material fərqli şeylər, hər şey bir obyekt "kafedrasının" belə ki, bir maşın, öyrətmək üçün - çox çətindir. Bu problem deyil. kompüter görmə üsulları inteqrasiya - fərziyyə, anlamaq təhlil etmək bir maşın öyrətməkdir.

müxtəlif platformalarda kompüter görmə inteqrasiyası

kompüter görmə kütləvi ilk üz detector yaradılmışdır zaman 2001-ci ildə daha nüfuz etməyə başladı. Viola, Jones: Biz iki müəllifləri etdi. Bu maşın öyrənmə üsulları gücünü nümayiş ilk sürətli və etibarlı kifayət qədər alqoritm idi.

İndi kompüter görmə kifayət qədər yeni praktiki applications var - insan sifətinin tanınması.

Amma film kimi insan tanımaq - təsadüfi açılar müxtəlif işıqlandırma şəraitində - bu, mümkün deyil. Amma problem, və ya müxtəlif işıqlandırma ilə və ya pasport fotoşəkil kimi oxşar fərqli bir yaradır, müxtəlif insanlar var bir həll, bu inamın yüksək dərəcəsi ilə mümkündür.

üz tanıma alqoritmləri xüsusiyyət əsasən pasport foto tələblər.

Bir biometrik pasport varsa Məsələn, bəzi müasir hava, siz avtomatik pasport nəzarət sistemi istifadə edə bilərsiniz.

kompüter görmə faili məchul problem - hər hansı bir mətn tanımaq imkanı

Bəlkə kimsə OCR sistemi istifadə olunur. Bunlardan biri - bir Fine Reader RuNet sistemində çox populyardır. Siz data doldurmaq çox formaları, onlar mükəmməl, skanerdən məlumat çox yaxşı sistem tərəfindən tanınır var. Lakin şəkil hər hansı bir mətn ilə bağlı vəziyyət çox pisdir. Bu problem hələ həll olunmamış qalır.

kompüter görmə cəlb oyunlar, motion capture

Ayrı-ayrı böyük sahəsi - üç ölçülü modelləri və (kifayət qədər uğurla kompüter oyunları həyata keçirilir) hərəkət ələ yaradılmasıdır. kompüter görmə istifadə edən ilk proqram - kompüter gestures istifadə edərək qarşılıqlı sistemi. Bu yaradılmışdır zaman açıq bir çox şeyi idi.

alqoritm sadəcə nəzərdə tutulmuşdur, lakin bu bir milyon şəkillər almaq üçün insanların sintetik images bir generator yaratmaq etmişdir konfiqurasiya. onlarla superkompüter indi yaxşı işləyir olan alqoritm, parametrləri seçin.

Bu bir milyon images və mümkün həftə countable superkompüter vaxt real vaxt mövqe qəbul bir şəxs bir prosessor gücünün 12% istifadə və imkan verir ki, bir alqoritm yaratmaq var. Bu Microsoft Kinect sistemi (2010).

məzmunu ilə images üçün axtarış sistem photos yüklemek üçün imkan verir, və bu nəticələri eyni məzmunlu bütün şəkillər vermək və eyni bucaq edilən edəcək.

kompüter görmə Nümunələr: üç ölçülü və iki ölçülü xəritələr indi ilə edilir. naviqasiya avtomobillər üçün Maps müntəzəm DVR görə yenilənir.

coğrafi etiketli photos milyardlarla bir verilənlər bazası var. bazasında şəkil indirerek, siz bunu, və hətta bəzi perspektiv ilə olduğu müəyyən edə bilər. Əlbəttə ki, yer turistlər bir zamanda kifayət qədər məşhur ki və ərazinin photos bir sıra var etdi.

robotlar hər yerdə var

hər hansı bir şəkildə olmadan hər yerdə hazırda da Robotics. İndi sürücü (bu kompüter proqramı keçirmək üçün bir şəkildə, avtomobilçi kömək edir) əmrləri ötürmək üçün piyadaların və yol əlamətləri tanımaq xüsusi kameralar vasitə var. Və tam avtomatlaşdırılmış qutusu vasitə, lakin onlar əlavə məlumat böyük məbləğdə istifadə etmədən video kamera sistemi etibar edə bilməz.

Modern kamera - bu bir analoq kamera obscura edir

digital image haqqında danışmaq edək. Modern digital kameralar qaranlıq kamerada prinsipi təşkil edilir. Yalnız əvəzinə ışık olur və mövzu dövrə kamera arxa divar üzərində proqnozlaşdırılır vasitəsilə deşik, biz xüsusi bir optik sistem lens adlı var. Onun obyekt böyük ışık toplamaq və bütün şüalar proyeksiya almaq və film və ya matrix bir şəkil yaratmaq üçün bir virtual nöqtəsi keçib ki, bu çevirmək üçün edir.

Modern digital kameralar (matrix) fərdi elementləri ibarətdir - piksel. Hər bir pixel pixel cəmi hadisə işıq enerji ölçmək və bir çıxış nömrəsini verə bilər. Buna görə də, bir digital kamera, biz əvəzinə bir pixel tutuldu image parlaqlıq set işıq ölçmə, almaq - kompüter baxımından sahəsində. Ona görə də biz görürük image xətləri və aydın kontur, və müxtəlif rəngli rəngli meydanların bir grid axan zaman - piksel.

Siz dünyanın ilk digital image görmək olur.

Amma bu şəkil deyil? Color. rəng nədir?

rəng psixoloji qavrayış

Color - Bu görürük budur. insan və pişiklər üçün bir rəng və eyni şey fərqli olacaq. biz (insanlar) və heyvan optik sisteminin ci ildən - görmə fərqlidir. Buna görə də, rəng - bu obyektlərin və işıq müşahidə zaman baş verir ki, bizim görmə psixoloji keyfiyyəti var. Və obyekt və yüngül bir fiziki əmlak. Color - yüngül komponentlərinin qarşılıqlı və vizual sisteminin səhnə nəticəsidir.

Python istifadə kitabxanalarda Programming Computer Vision

Siz kompüter görmə öyrənilməsi ciddi məşğul qərar varsa, dərhal çətinliklər bir sıra üçün hazırlamaq lazımdır, bu elm asan deyil və pitfalls bir sıra gizlədir. Amma Jan Erik Solema müəlliflik "Python haqqında Programming Computer Vision" - bütün ən sadə dil müəyyən bir kitab. Burada 3D müxtəlif obyektlərin tanınması üsulları ilə tanış olacaq, stereo image, virtual reallıq və kompüter görmə bir çox digər proqramları ilə işləmək üçün öyrənmək. Kitabda Python kifayət qədər nümunələridir. Amma şərhlər çox araşdırma və ağır data yükləməyə deyil, belə ki, belə ki, ümumiləşdirilmiş, danışmaq, təqdim olunur. tələbələr, həvəskarlar və meraklıları üçün uyğun çalışır. kompüter görmə (pdf formatında) haqqında bu kitab və başqaları Download şəbəkə ola bilər.

Hal-hazırda, kompüter görmə alqoritmləri və görüntü emal və ədədi alqoritmlər OpenCV açıq mənbə kitabxana var. Bu ən müasir proqramlaşdırma dilləri həyata keçirilir, açıq mənbəyidir. biz kompüter görmə haqqında danışmaq, Python bu da kitabxana dəstəyi var, bir proqramlaşdırma dili kimi istifadə edir, əlavə, o, daim inkişaf edir və böyük bir icma vardır.

şirkəti "Microsoft" öz xidməti Api-edə insanların şəkillər ilə işləmək üçün neyron şəbəkə məşq təmin edir. kompüter görmə müraciət etmək imkanı da var, Python bir proqramlaşdırma dili kimi istifadə edir.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 az.delachieve.com. Theme powered by WordPress.