Skočiť na obsah Skočiť na menu

Inet.sk - internetový denník

internetový denník

Threads, fibres (and spiders)

Týmto článkom by som rád začal seriál o vláknach a o programovaní pomocou vláken. Metodicky bude seriál rozdelený na teoretickú časť a na použitie v prostredí Windows a Linux. Kedže vlákna nie sú súčasťou špecifikácie C, prípadne C++, je prístup v oboch operačných systémoch rozdielny, i keď logika prístupu ostáva rovnaká.


V úvodnom článku si povieme čo to vlastne programovanie pomocou threadov (vláken) je a zavedieme si sadu všeobecných pojmov, s ktorými budeme pracovať. Predpokladám, že čitateľ má ako takú predstavu o tom ako to vo vnútri počítača vyzerá.

Program (Program) – je to spojenie algoritmov, dátových štruktúr a prostriedkov do jedného celku, ktorý je ako konečný produkt reprezentovaný postupnosťou inštrukcií, ktoré vykonáva processor.

Proces (Process) – je to inštancia programu – fyzická podoba v pamäti počítača. Má svoj pamäťový priestor (viruálne mapovaný), vykonávaný kód, ktorý sa dostáva na processor cez plánovanie Operačného Systému (OS). Procesu je priradený tzv. kontext. Ten obsahuje hodnoty rôznych registrov procesoru (napr. PC – program counter – adresa inštrukcie, ktorá sa má ako ďalšia spracovávať processorom, SP – stack pointer a ďalšie registre – záleží od processoru). Proces sa dnes chápe aj ako obálka zdrojov – pamäť, zariadenia, vlákna atď.

Jadro (Kernel) OS – je to proces ktorý je priamo zodpovedný za interakciu medzi hardvérom a ostatnými procesmi, je zodpovedný za periférie, zariadenia a ich obsluhu. Je rovnako zodpovedný za medziprocesovú komunikáciu a rozdeľovanie prostriedkov medzi procesy (prípadne vlákna). Problematika kernelov je natoľko rozsiahla, že by bolo treba minimálne ďalší seriál na to aby sa do nej dalo aspoň povrchne preniknúť.

Plánovač (Scheduler) – často proces OS, prípadne priamo súčasť kernelu (jadra) OS. Plánovanie v  moderných OS je preemptívne (žiaden proces si nemôže uzurpovať proces), pre procesy transparentné. Plánovanie musí byť priamo hardvérovo podporované processorom. Je realizované pomocou spracovávania generovaného prerušenia časovača.

Vlákno (Thread) – vlákno je entita, ktorá existuje v rámci jedného procesu ako podproces. Zdieľa svoj adresový priestor s inými vláknami vytvorenými v rámci daného procesu. Vlákna môžu byť rôzneho druhu. Poznáme kernelové vlákna, light weight vlákna a užívateľské (user) vlákna. Rozdiel medzi jednotlivými vláknami je v úrovni na ktorej bežia.

Kernel vlákna sú záležitosť jadra processoru a bežný užívateľský kód k nim nemá prístup. Bežia v pamäťovom priestore jadra OS. Light weight vlákna sú vlákna, bežia v rámci pamäťového priestoru jedného procesu (ktorý ich vytvoril) ale sú plánované operačným systémom. Užívateľské vlákna niesú videné jadrom OS a sú brané ako súčasť procesu ako celku (v NT jadrách OS Windows sú nazývam “Fibre“). V prípade užívateľských vláken si musí programátor sám napísať plánovanie vláken na úrovni procesu. Tento prístup sa volá User Managed vlákna. V opačnom prípade sa jedná o Kernel Managed vlákna.

Vlákna môžu mať priradené rôzne priority a existujú viaceré druhy vláken. Ale bližšiemu rozdeleniu sa budeme venovať až neskôr.

Blokovanie vlákna (thread blocked) – stav kedy je vykonávanie vlákna pozastavené. Beh vlákna môže byť znova obnovený po splnení určitých podmienok.

Spánok (Sleep) – každé vlákno môže prejsť do stavu, kedy spí – čiže nevykonáva žiadnu činnosť po určitú dobu, alebo pokiaľ vlákno nieje prebudené iným vláknom (WakeUp).

Uviaznutie (Deadlock) – je to situácia, kedy dôjde k zablokovaniu vláken čakajúcich sa takým spôsobom, že žiadne sa nemôže prebudiť. Jednoduchý príklad je keď proces A vlastní prostriedok X a čaká (je blokovaný) na prostriedku Y a proces B vlastní naopak prostriedok Y a čaká na prostriedok X. Takto obaja čakajú a budú čakať štastne až do rebootu.

Dosť bolo technickej terminológie. Ak som vás neznechutil nezaujímavou, ale podstatnou hatmalikou, môžme pokročiť k idei vláken.

Predstavte si situáciu, že navrhujete program a radi by ste boli, aby sa niektoré udalosti diali paralelne, alebo aspoň aby sa paralelne tvárili. Reálny paralelizmus na jednoprocesorových architektúrach je neuskutočniteľný (vždy sa načítava totiž len jedna inštrukcia do procesora, i v prípade použitia tzv. pipeline). Vlákna sú na processore striedané dostatočne rýchlo a na ľudské vnímanie to pôsobí paralelne.

Inou aplikáciou vláken je potreba programu, aby obsluhoval viacero udalostí súčasne. Predstavte si jednoduchý server, ktorý v hlavnom vlákne čaká na spojenia a pri obsluhe vytvára pre každé obsluhované spojenie nové vlákno, ktoré sa ďalej stará o obsluhu spojenia.

Dôležitým aspektom programovania multithredovo (viacvláknovo znie o dosť horšie), je programovať bez predpokladu dĺžky behu kusu kódu. Nevieme totiž kedy dôjde k preplánovaniu. Ďalšou dôležitou podstatou je schopnosť identifikovať miesta, kde by preplánovanie a prístup iného vlákna spôsobili vážne škody – kritické sekcie (vznikajú tzv. race conditions). O kritických sekciách si povieme v ďalších dieloch seriálu.


Predpokladaný počet článkov odhadujem na aspoň desať. Články by mohli vychádzať v týždňových intervaloch. Na tento seriál bude pravdepodobne voľne nadväzovať séria o sieťových prostriedkoch a ich použití.

A na záver ešte drobná informácia o používanom jazyku a prostredí. Budeme používať výhradne C++, prípadne C, všetky projekty budú vytvárané v prostredí Visual Studio 6, prípadne Visual Studio .NET.


nasledujúci článok =>



Pôvodná diskusia k článku

Netvrdil bych, že vlákno je podproces. Je to lingvisticky nevhodné použití předpony pod. Zavedení pojmu vláken do OS totiž jasně rozdělilo původní procesy na dvě disjunktní věci: proces a vlákno. A jelikož jsou to pojmy disjunktní, nemůže být jeden částí druhého. Aby vlákno mohlo být podprocesem, muselo by být jakousi částí procesu nebo něčím takovým. A to není.Pokud začneme vláknu říkat podproces jen kvůli tomu, že s procesem souvisí, můžeme pak zásobníku říkat podvlákno - jeho vazba na vlákno je totiž stejná jako vazba vlákna na proces. A nebo obráceně: Proces je podvlákno. Dokažte, že to není pravda. Z hlediska OS je toto tvrzení ekvivalentní tomu původnímu. (Ať už Windows či Linux, obojí staví vlákna a procesy na jednu úroveň - není tam množinový vztah typu "pod"...)Podobně platí, že dvě vlákna mohou sdílet paměť jednoho procesu, podobně jako dva procesy mohou sdílet jeden soubor na disku. Je snad potom takový proces podsouborem? Asi těžko. :-)

28. 01. 2006 Al 212.24.148.xxx

<cite />Tato terminologia je tak trosku nejasna. V OS windows su vlakna chapane inak ako napr v Linuxovych jadrach pod 2.4, alebo solarisoch. Pojem podproces je trosku zle zvoleny pojem, ale snazil som sa najst nejaku rozumnu analogiu.To ze sa v OS rozdelili procesy a vlakna na disjuktne veci tiez nieje presne tvrdenie a docela zavadzajuce. Napr uz v spominanych Widlach je proces len kontextova a prioritna obalka vlaken.To s tym zasobnikom som 2x nepochopil.Prave Windows (od jadra NT3.1 myslim) chapu vlakna trosku inak ako Linux. V pripade linuxu/unixu je aj iny model planovania (O(1) planovac) ako vo Windows, kde je planovac podobny napr SOlarisom.Vlakna v Linuxe maju aj inak rieseny kontext ako napr Windows vlakna (ak si to pametam spravne). Dynamicke priority su riesene tiez inak.Pouzite analogie su podla mna dost chytristiky a unika vam podstata tej predstavy.Podstatne je ze viacero vlaken (napr vo Win) tvori proces, jednovlaknove processy - tam plati ze vlakno je vlastne process.Pravdepodobne som niektorych citatelov zatazil priliz velkou davkou na ich predstavivost, dam si nabuduce pozor.

29. 01. 2006 vegetta [autor] 195.113.26.xxx

Myslím, že je úplně jedno, jak dané věci řeší konkrétní operační systémy. Je absolutně nepodstatné, že Windows se chová jinak než Linux. Terminologie ve stylu "vlákno=podproces" je prostě vadná, je používána jen sporadicky a má logické opodstatnění jen jako jisté nepřesné přirovnání. Ve skutečnosti je třeba se na věci dívat obecně, bez ohledu na konkrétní operační systémy. Ty Windowsy a Linuxy totiž napsali lidé až potom, co nějací vědci vymysleli teorii vláken a procesů. A to "teoreticko-vědecké" pozadí je pořád stejné, bez ohledu na implementaci.Pojem "podproces" považuji za výsledek náhledu ve stylu: "Tak máme procesy. A jak si představíme vlákna?" Toto je ale zastaralý pohled člověka, který dříve znal jen procesy a teď se snaží nějak pojmenovat, co to jsou ta vlákna, která tu jsou "navíc". Takto ale současné operační systémy nefungují. Ve skutečnosti vlákno reprezentuje čas CPU, zatímco proces je kontext programu, do kterého bychom samotný výpočetní čas neměli přímo plést. Vlákna navíc technicky vzato nezůstávají jen v jednom procesu, protože například na počítačích PC (bez ohledu na operační systém) může vlákno pomocí přerušení "cestovat" mezi procesy. To jsou ale již velmi technické detaily...

06. 02. 2006 Al 212.24.148.xxx

Je Vaša doména voľná?

Platená reklama

Textová reklama

Ako začať podnikať na internete? Nechajte si poradiť. Aký má byť obsah kvalitne www stránky? Tvorba www stránok, Tvorba webu, Redakčný systém - CMS, Prieskumy o nakupovaní na internete, Pôžičky
Kompletné informácie o Kika Banská Bystrica | Čo takto navštíviť Viedeň? | Zaujímavé informácie priamo od zdroja

Newsletter


Copyright © 2002 - 2012 Inet.sk, s. r. o.Všetky práva vyhradenéNeprešlo jazykovou úpravouISSN 1336-1899

Využívame kvalitný webhosting za rozumnú cenu od Webhosting Inet.sk


Bilancia skrývky Fotokniha Fotografie Osobnosti.sk