helenos-nicf team mailing list archive

Thread
Date

Re: Report

To: helenos-nicf@xxxxxxxxxxxxxxxxxxx
From: Jirka Michalec <michy@xxxxxxxxxx>
Date: Wed, 06 Jul 2011 13:31:57 +0200
In-reply-to: <4E11B034.7090907@matfyz.cz>
User-agent: Mozilla/5.0 (X11; Linux i686; rv:5.0) Gecko/20110628 Thunderbird/5.0

Ahoj,

věnuji se testování a opravování chyb. Při testování jsem rozšířilnicconf a nictest o podporu polling mode a opravil některé s tímsouvisející deadlocky a pád ildummy. Přidal jsem několik záznamů domantisu (některé jsou co se řešení týče triviální, jen bych k nim rádměl i jiný názor na to, které z řešení je lepší pro případ, že mi něcouniklo).

Konečně se mi též podařilo nabootovat na reálném HW a testovat tam.

Z celkem pěti karet, které mám k dispozici, byly 4 detekovány apřiřazeny ke správnému driveru, jedna nikoliv (zřejmě používá jinévendor ID a device ID, bohužel toto už ve výpisu do kernel console není,ale čekám, že až tyto informace do výpisu přidám, zbývající kartu rychlezprovozním).Všechny detekované karty vykazují naprosto stejné chování (alespoň vrámci testovaných funkcionalit): po startu funguje přijímání i odesílánípacketů (broadcast i unicast), nefunguje změna MAC adresy (přijímajístále na původní) a po změně bcast modu přestane přijímat úplně (změnyostatních jsem zatím nezkoušel), v QEMU vše zmíněné funguje správně.V QEMU jsem stále nedokázal zprovoznit periodický polling, on_demandfunguje správně, stejně jako přijímání pomocí přerušení.

Dále budu pracovat na odstraňování chyb a uváděním všech karet dosprávně fungujícího stavu.

A mám taky jednu otázku ohledně designu: ve funkcích ohledně alokovánípacketů je race, který způsobuje, že občas se prostě nepodařínaalokovat packet, ačkoliv možné to je (ještě nedošla paměť). Zamykatby to ani nešlo a v podstatě to není problém - otázkou ale je, jestlito má řešit knihovna (cyklit, dokud se nepodaří naalokovat), uživatel(dostane chybu, že se nepodařilo alokovat, ať si dělá co chce) nebojestli to zkusit třeba 8x v cyklu naalokovat a když se to nepodaří anijednou, tak teprve tehdy vrátit chybu. Já bych byl pro to poslednířešení, co vy na to?

Můžeš se trochu více rozepsat o tom, kde ta race je, příp. ve kterýchfunkcích se projevuje (jde-li o race na straně packet serveru čidriveru)? Jedna race je v dma_allocate_anonymous (při volání ze dvouvláken mohou obě najít stejnou volnou virtuální adresu, avšak vytvořenímapování se povede jen jednomu) - o tom jsem už mluvil na jedné zeschůzek, když jsme DMA řešili, a shodli jsme se, že finální řešení budev případě neúspěchu několikrát zopakovat postup a vrátit neúspěch ažpoté (ale zdá se mi, že to zapadlo). V tomto případě by šlo i zamykat,ale jen globálním zámkem v celé DMA knihovně (což ale nepomůže přisoučasném volání jiných funkcí alokujících paměť mimo DMA knihovnu),rozumnější mi opravdu přijde zkusit několik pokusů. Na druhou stranu jeotázkou, zda-li má opravdu tato funkce myslet na možnost více vlákenvolajícího nebo si to má volající zajistit sám.Co se alokace packetu týče - IMO typycká aplikace (driver) poběží vněkolika vláknech a tudíž by tyto funkce měly s více vlákny počítat asnažit se to rozumně řešit. Poslední zmiňované řešení se mi též líbínejvíce, v takovém případě by bylo dobré odlišit návratový kód "opravdunení paměť" od "nastal race, příště se to možná podaří" - otázkou aleje, jestli je toto schopen framework rozlišit, např. dma_allocate vracív případě neúspěchu ENOMEM nehledě na důvod.


Michy

Follow ups

Re: Report
From: Radim Vansa, 2011-07-07

References

Report
From: Radim Vansa, 2011-07-04