helenos-nicf team mailing list archive

Thread
Date

Re: uvolnovani paketu po zavolani write_packet

To: helenos-nicf@xxxxxxxxxxxxxxxxxxx
From: Radim Vansa <radim.vansa@xxxxxxxxx>
Date: Fri, 22 Apr 2011 00:55:24 +0200
In-reply-to: <4DB0ABAD.3040405@tiscali.cz>
User-agent: Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.2.15) Gecko/20110303 Thunderbird/3.1.9



On 22.4.2011 0:11, Jirka Michalec wrote:

Stejně jako Zdeněk si myslím, že nekopírovat packety je prioritačíslo 1 a té se musí podřídit vše. I když by to vyžadovalo existencipacket serveru nebo nějaké jiné hraní si s právy na alokaci DMA,prostě kopírovat se nesmí, pokud to karta umožňuje (což E1000 dělá, uRTL to musíš nakopírovat do toho vnitřního bufferu stejně, že?).
Technicky vzato nemusim - mohu prenastavovat adresu bufferu proodeslani na fyzickou adresu dat packetu.
Optimalizovat by se mělo pro typický případ - nejspíše ten, že packetje z největšího rozsahu, který většina karet podporuje, což je32bitový rozsah. Není to tak velké omezení a karty, které zvládají64bitový rozsah, prostě tu featuru nevyužijí.Karta tak vždy ověří, že packet je v rozsahu, který podporuje a pokudvyžaduje menší rozsah, tak holt musí přealokovat packet a kopírovatnebo si to nějak přizpůsobit. Pokud by tohle měl být velký problém,tak se může do systému doimplementovat nastavení říkající, z jakéhorozsahu se mají packety alokovat (ale to už je záležitost net stackua ne nás).
Priorita cislo jedna to teoreticky byt muze, ale pri pritomnostipacket serveru bude komunikace s nim uzkym hrdlem systemu - cili mistozdrzeni pri kopirovani dat dojde u packetu ke zdrzeni kvuli IPC,cekani na zamky v packet serveru. A jelikoz se alokace packetu dejenezavisi na zarizeni, pres ktere packet odejde (to ani nemuze bytznamo), bude dochazet ke kolizim i s packety jdoucimi napr. do lorozhrani, ktere vlastne vubec zadnou DMA nepotrebuji. Ano, cekani nazamky se nepujde zbavit ani pokud aplikace vyuzije DMA primo kvulizamykani v dma_allocate (nehlede na dalsi zdrzeni az bude DMA server=> IPC). A ted je otazkou: je rychlejsi kopirovani 1.5kB dat (vprumeru zrejme mene, me ve statistikach sitovky na notebooku vychaziprumer cca 150B/packet) nez poslani IPC zpravy (=> 2x context switch)+ alokace DMA pameti + kolize se vsemi novymi packety v systemu? Primereni (linux, gcc, prumer ze 100 000 000 kopirovani, HelenOSimplementace) mi vyslo kopirovani 1522B casove ekvivalentni 4040instrukcim s -O0, 845 s -O3 a (pro srovnani) 485 v linuxoveimplementaci (resp. nejspis memcpy zabudovana v gcc), u 150B to je 470(-O0), 130 (-O3) a 130 (linux). To mi (zejmena ta verze s -O3) prijdeprijatelne, pokud se jinde v network stacku nic kopirovat nebude.Mimochodem, pamet alokovatelna pro DMA muze byt omezenym zdrojem tudizalokace packetu skrz DMA na strane aplikace se zvysuje pravdepodobnostneuspechu pri teto alokaci, zvlast, kdyz se tak budou alokovat ipackety, pro ktere to neni potreba.
Osobne myslim, ze pristup "toto je priorita cislo 1 a vse se tomu musipodridit" neni nejlepsi. Chce si to rozmyslet, jaka je cena okolo ajak to bude rychlejsi. Ostatne pristup "priorita cislo jedna" takeobcas vede k ne zrovna peknym resenim.

Máš pravdu, špatně jsem vyjádřil, co je tou prioritou. Tou je mítmaximálně rychlé předávání packetů - a možná beru mylný předpoklad(pocházející z monolitických kernelů), že kopírovat tu paměť je přílišdrahá operace. Pro správné uvážení by to chtělo mít nějaké odhadyperformance IPC. Ovšem nějaké bottleneckovitosti packet serveru/DMA bychse zase tak nebál, pokud by se ukázalo, že to něco brzdí, tak se alokacea uvolňování packetu v nějakých cache-frontách dají implementovat lock-free.

Jeste mne napada jeden mozny pristup: mit volani zajistujici, zenejaka pamet se stane pristupna pro DMA - obdoba linuxovehodma_map_single/dma_unmap_signgle, v soucasnosti (jeden packet v jednestrance) spise obdoba dma_map_page/dma_unmap_page, ta pro DMA nastavijednu stranku. V podstate by slo jen o zjisteni fyzicke adresy azajisteni, aby po celou dobu pouzivani pameti k DMA prenosu nedoslo kjeji zmene (pri absenci swapovani to znamena znemoznit jeji uvolneni -neni to nahodou rovnou zajisteno nasdilenim stranky?). Takoveto resenima vyhodu v tom, ze aplikace alokujici packet o DMA vubec vedet nemusi(=> nemusi mit zadna zvlastni prava) a vse si zajisti driver sam, aleneresi to problem u zarizeni pracujici jen v 32bit adresach na 64bitstroji (ten by resilo jen nastaveni "pamet pro packety alokovat pouzev dolnich 32 bitech"). Jak je to vlastne s e1000? Ta zvlada 64bitadresy ci nikoliv?

Tohle je asi otázka na Honzu, jestli v tom není nějaký zádrhel. Tedy propřijímané packety by driver požadoval od DMA nějakou paměť a proodesílané by si (v případě potřeby) zjistil její adresu. Nicméněaplikační úroveň (resp. knihovna) by o tom, že tato paměť je nějakzvláštní a musí se uvolňovat skrze DMA stejně musela vědět, ne? Nebo jakzjistí DMA, že ji může znovu přidělit?

Dobrá, klidně se jej na to můžeme zeptat. Napíšeš mu, nebo mám já?
To je jedno, klidne mu napisi, pokud chces.
Hmm, v tom případě bych zauvažoval o tom uvolňování podle návratovéhodnoty, protože se mi z hlediska uživatele vůbec nelíbí mít dvěfunkce na uvolňování packetu, které se mají použít podle kontextu a vjednom případě způsobí deadlock a ve druhém ještě hůře nějakénedefinované chování.
Ano, to je asi rozumnejsi. Sam bych se priklanel k variante, aby sidriver musel vynutit neuvolneni (cili "packet se uvolni, nerekne-lidriver opak"). Prijde mi to i cistci v tom, ze takova navratovahodnota bude jinou variantou uspechu, pripadne chybove kody (ukaze-lise, ze se v nejakem pripade bude hodit rici "packet jsem nemohlodeslat") budou pouzitelne s automatickym uvolnenim packetu.
I když je tu ještě jedna alternativa - nezamykat vůbec pro uvolňovánípacketu a místo toho jenom vytvořit session, ve které se ta zprávaodešle (čili bez synchronizačních problémů). Popravdě jsem se zatímasync sessions vyhýbal, ale asi bych je do komunikace měl zanést -tím pádem by se nemuselo zamykat jenom kvůli posílání nějakých zpráv(ono se vlastně nemusí zamykat ani teď, protože poslání jedné zprávyje atomické, ale "uzamykat resource" pro komunikaci mi přišlo jakodobrý nápad).
Nemuze u async sessions dochazet k problemum s prohazenim poradi akciruznych vlaken stejneho device? Resp. v NICF me nenapada me nic, kdeby predbehnuti zpravy jineho vlakna mohlo vadit, ale spis jestli jsemneco v tomto smeru neprehledl... Jinak to zni jako dobre reseni - vdriverech bude o nebezpeci deadlocku mene.

Pořadí "současné" komunikace je stejně nedefinované - sessions zajistíto, že se komplikovanější komunikace sestávající se z více IPC zprávnebudou prolínat.


Radim

Follow ups

Re: uvolnovani paketu po zavolani write_packet
From: Jirka Michalec, 2011-04-21

References

uvolnovani paketu po zavolani write_packet
From: Zdenek Bouska, 2011-04-18
Re: uvolnovani paketu po zavolani write_packet
From: Jirka Michalec, 2011-04-19
Re: uvolnovani paketu po zavolani write_packet
From: Zdenek Bouska, 2011-04-19
Re: uvolnovani paketu po zavolani write_packet
From: Radim Vansa, 2011-04-20
Re: uvolnovani paketu po zavolani write_packet
From: Jirka Michalec, 2011-04-20
Re: uvolnovani paketu po zavolani write_packet
From: Radim Vansa, 2011-04-20
Re: uvolnovani paketu po zavolani write_packet
From: Jirka Michalec, 2011-04-21