Databáze s textovými soubory
Textový soubor obecně
- tisknutelné znaky + vložené znaky pro konce odstavců
1 |
Otevřte ve Wordu dokument Chameleon.docx |
Word |
2 |
Dokument uložte jako prostý text pod jménem Chameleon.txt v
kódování Windows |
- Formát - ukončení řádků - DOS (Carriage Return+Line Feed), Unix, Mac
3 |
Otevřte soubor Chameleon.txt v PSpadu, zobrazte skryté znaky
a všimněte si konců odstavců |
PSPad |
4 |
V PSPadu proveďte Zobrazit - Hexadecimálně a zjistěte čísla
znaků konců odstavců |
5 |
Otevřte v Excelu sešit Fox.xlsx a odpovězte na otázky v listu
CRLF |
Excel |
Konverze textových dat
- úkolem je přeměnit data ze souboru MusicMix.cue na playlist s řádky ve
tvaru 01 - Interpret - Název skladby
- ve Wordu se nahradí konce odstavců + mezery (^p___) tabulátory
(^t) a vloží
přes schránku do Excelu
- v excelu odstranit řetězce, sloučit sloupce operátorem
&
6 |
Otevřte soubor MusicMix.cue ve Wordu a zobrazte skryté
znaky |
Word |
7 |
Nahraďte znaky tak, aby každá skladba (track) byla uvedena jen na
jednom řádku (mezi budoucími sloupci bude znak Tabulátor) |
8 |
Zkopírujte řádky s TRACKy do nového listu MusicMix sešitu
Fox.xlsx a nahrazením odstraňte slova TRACK, AUDIO, TITLE, PERFORMER |
Excel |
9 |
Playlist vytvořte do sloupce E sloučením sloupců A, B, C ve tvaru
"Číslo tracku - Performer - Title" |
Kódování češtiny
- základ - znaky bez diakritiky - 7 bitů (128 znaků) -
ASCII
- 1 bytové = 8 bitů = znaky 1-255 (0 se
nepoužívá) - CP1250/ANSI
10 |
V listu Kódování sešitu Fox.xlsx vytvořte ve sloupci
Kód řadu čísel 1-500 |
Excel |
11 |
Sloupec ANSI vyplňte vzorcem podle vzoru =znak(A2) a všimněte
si znaků od čísla 255 |
12 |
Sloupec LowerCase vyplňte vzorcem podle vzoru =znak(A2+32) a
všimněte si znaků od velkého A dále |
- pozn. opačná funkce =kód()
- zkusit převod na malá písmena =znak(kód(A2)+32), kdy v A2 je
velké písmeno
- vícebytové kódování - Unicode - nejčastěji verze UTF-8 (7 bitové ASCII
znaky jsou uloženy jako byte s prvním bitem 0, ostatní národní znaky se
ukládají na 2-4 byty) - textový soubor je uvozen 2-3 byty
BOM (FF FE nebo
EF BB BF )
13 |
Zobrazte soubor utf8.txt v www prohlížeči a nastavte
správné zobrazení češtiny |
www |
14 |
Otevřte soubor utf8.txt v PSPadu a zobrazte jej
hexadecimálně - všimněte si úvodní sekvence a zkontrolujte
nulový první bit u prvního písmena bez diakritiky (v programátorské
kalkulačce) |
PSPad |
15 |
Odpovězte na otázku v listu UTF8 sešitu
Fox.xlsx |
Excel |
16 |
Sloupec Unicode v listu Kódování sešitu Fox.xlsx
vyplňte vzorcem podle vzoru =unichar(A2) |
Excel |
- pozn. opačná funkce =unicode()
Abecední řazení
- řazení řetězců - obr.
- řazení češtiny
- abcčdefghchijklmnopqrřsštuvwxyzž
- ostatní písmena s diakritikou se řadí jako písmena bez diakritiky (a=á,
d=ď, e=é=ě atd.)
- velká a malá písmena mají stejnou platnost (case insensitive)
- písmena z jiných abeced než z latinky (např. cyrilská, řecká, hebrejská,
arabská) se řadí podle jejich přepisu do latinské abecedy (např. řecké α
jako alfa)
- algoritmy řazení - bublinkové -
animace, wiki
Formáty datových textových souborů
a) Pevná délka polí - formát PRN
- pozn. sloupcové bloky ve Wordu (Alt+myš), PSPad - Úpravy - Druh bloku
17 |
Otevřte v Excelu soubor Doping.prn - v dialogu nastavte
správnou češtinu a rozhraní sloupců pomocí šipek (celkem 7 sloupců) |
Excel |
18 |
Seřaďte tabulku abecedně (A-Z) podle názvu přípravku a list
přesuňte do sešitu Fox.xlsx |
b) Pole s oddělovacími znaky - CSV (comma separated values) - př. řádku:
sloupec1;sloupec2;sloupec3
- pokud je v textu oddělovací znak, text se dá do uvozovek "sloup;ec1"
- pokud je v textu znak uvozovka, pak se uvozovka zdvojí "slou""pec1"
19 |
Do nového listu PSČ v sešitu Fox.xlsx importujte v
Excelu soubor psč.csv tak, aby data tvořily sloupce (Data - Z
textu) |
Excel |
20 |
Uložte list TestCSV ze sešitu Fox.xlsx jako soubor s
oddělovači Test.CSV |
21 |
Otevřte Test.CSV v PSPadu - všimněte si uvozovek |
PSPad |
- Příklad použití: soubor *.SUB - filmové titulky - formát:
{začátek}{konec}text titulku
- začátky a konce jsou v počtu snímků od začátku filmu
(frekvence např. 25 snímků za vteřinu)
22 |
Importujte do nového listu Titulky v sešitu Fox.xlsx soubor s titulky FalesnaHra.sub tak, aby
ve sloupci A byl začátek titulku, ve sloupci B konec a v C text titulku
(ze sloupců A a B odstraňte nečíselné znaky) |
Excel |
23 |
Do sloupce D a E vložte vzorce pro zpoždění začátků a konců titulků o 10 vteřin a
přidejte formát zobrazení se složenými závorkami (výsledkem v buňce bude
např. {2410}) |
24 |
Uložte soubor Fox.xlsx a zkopírujte jej na fileserver |
|