Tento soubor obsahuje popis obsahu CD, jenz je soucasti bakalarske prace
"Metody extrakce viceslovnych vyrazu z textu" vypracovane na MFF UK v roce 2008.

Pripadne pripominky k praci, k obsahu CD apod. posilejte na adresu:
chester at matfyz dot cz

----- Obsah -----

1 README.txt -- prave ctete.

2 bin/ -- skompilovany program - nekolik verzi.  
  
  2.1 fedora-64/ -- OS Linux Fedora, GCC 4.1.2, -m64 -O3
  
    Verze pouzita pro vykonnostni testy (viz priloha C bakalarske prace).        
  
  2.2 gentoo-32/ -- OS Linux Gentoo, GCC 4.1.2, -m32 -O3
  
  2.3 win-32/ -- OS MS Windows, VS 2005 32-bit, /Ox /Ob2
  
  Kazdy podadresar navic obsahuje dve verze:
    - pace_hs -- verze pouzivajici hash_set (skompilovano s makrem
      _USE_HASHSET).
    - pace_hv -- verze pouzivajici hash_vector (vychozi verze).
  Vysvetleni rozdilu je uvedeno v kapitole 6.3.7 bakalarske prace.
  
3 data/ -- testovaci data.
    
    Jedna se pouze o malou cast dat korpusu PDT 2.0. Plna data bohuzel neni
    mozne distribuovat jako soucast teto prace.

4 docs/ -- programatorska dokumentace (v anglictine).

    Dokumentace je vygenerovana ze zdrojovych kodu programu pomoci nastroje
    Doxygen. Jednotlive html soubory jsou bez ramcu, takze staci otevrit
    libovolny z nich (vsechny obsahuji hlavni menu dokumentace). Vstupnim
    souborem je ale samozrejme soubor index.html.

5 src/ -- zdrojove kody programu, vcetne makefile.

    Kompilovani lze snadno ovlivnit temito parametry pro make:
      - binary -- cesta k vyslednemu skompilovanemu programu. 
      - params -- parametry pro g++ (pro kompilaci i linkovani).
    Pro smazani *.o souboru staci spustit make s prikazem "clean". 

6 thesis/ -- text prace ve formatu PDF a errata k praci.   
  
