1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850
851
852
853
854
855
856
857
858
859
860
861
862
863
864
865
866
867
868
869
870
871
|
<?xml version='1.0' encoding="UTF-8"?>
<!-- $Header: /var/cvsroot/gentoo/xml/htdocs/doc/ro/utf-8.xml,v 1.23 2006/04/02 15:57:04 alin Exp $ -->
<!DOCTYPE guide SYSTEM "/dtd/guide.dtd">
<guide link="/doc/ro/utf-8.xml" lang="ro">
<title>Folosirea UTF-8 cu Gentoo</title>
<author title="Autor">
<mail link="slarti@gentoo.org">Thomas Martin</mail>
</author>
<author title="Contribuitor">
<mail link="devil@gentoo.org.ua">Alexander Simonov</mail>
</author>
<author title="Editor">
<mail link="fox2mike@gentoo.org">Shyam Mani</mail>
</author>
<author title="Translator">
<mail link="scristian@gentoo.ro">Spoială Cristian</mail>
</author>
<abstract>
Acest ghid este pentru a seta şi utiliza setul de caractere Unicode UTF-8 cu
sistemul Gentoo Linux, după ce se explică beneficiile care le aduce Unicode, în
special UTF-8.
</abstract>
<!-- The content of this document is licensed under the CC-BY-SA license -->
<!-- See http://creativecommons.org/licenses/by-sa/2.5 -->
<license />
<version>2.19</version>
<date>2006-03-19</date>
<chapter>
<title>Codările Caracterelor</title>
<section>
<title>Ce Este o Codare de Caracter?</title>
<body>
<p>
Calculatoarele nu înţeleg singure textul. În schimb, fiecare caracter este
reprezentat de un număr. Tradiţional, fiecare set de numere utilizat pentru a
reprezenta alfabetele sau caracterele (cunoscut ca sistem de codare sau setul
de caractere) era limitat în mărime datorită limitărilor fizice ale
calculatorului.
</p>
</body>
</section>
<section>
<title>Istoria Codărilor de Caractere</title>
<body>
<p>
Cel mai comun (sau cel mai răspândit) set de caractere este <b>ASCII</b>
(American Standard Code for Information Interchange - Codul Standard American
pentru Schimbul de Informaţie). Este cunoscut faptul că ASCII este mai reuşit
standard software realizat vreodată. Codul ASCII modern a fost standardizat în
1986 (ANSI X3.4, RFC 20, ISO/IEC 646:1991, ECMA-6) de către American National
Standards Institute (Institutul Naţional American pentru Standarde).
</p>
<p>
ASCII este strict din şapte biţi, asta însemnând că foloseşte modele de biţi
reprezentate cu şapte numere binare, care pune la dispoziţie un interval de la
0 la 127 în decimal. Acestea include caracterele de control nevizibile 32, cel
mai multe fiind între 0 şi 31, cu caracterul final de control, DEL sau delete
la 127. Caracterele de la 32 la 126 sunt caractere vizibile: un spaţiu, semne
de punctuaţie, litere latine şi numere.
</p>
<p>
Al optulea bit din ASCII a fost folosit la început pentru bitul de paritate la
verificarea erorilor. Dacă acest lucru nu este dorit, este lăsat ca 0. Asta
înseamă că ASCII foloseşte pentru fiecare caracter un singur octet.
</p>
<p>
Cu toate că ASCII era de ajuns pentru comunicaţiile în engleza modernă, în alte
limbi europene care includ caractere accentuate, lucrurile nu erau aşa uşoare.
Standardele ISO 8859 au fost create pentru a satisface aceste nevoi. Erau
compatibile în sens invers cu ASCII, diferenţa este că se foloseşte al optulea
bit pentru a permite alte 127 caractere în fiecare codare. Curând, limitările
ISO 8859 au început să iasă la iveală, momentan sunt 15 variante al
standardului ISO 8859 (începând cu 8859-1 şi terminând cu 8859-15). În afară de
raza octetului de compatibilitate ASCII al acelor seturi de caractere, erau
conflicte dese în literele reprezentate de fiecare octet. Pentru a complica şi
mai mult interoperabilitatea dintre codările caracterelor, Windows-1252 este
folosit în anumite versiuni de Microsoft Windows în loc de limbile Vest
Europene. Acesta este un superset al ISO-8859-1, dar este diferit în multe
locuri. Totuşi, aceste seturi păstrează compatibilitatea cu ASCII.
</p>
<p>
Dezvoltarea necesară unor codări diferite singur-octet pentru alfabetele
nelatine, cum ar fi EUC (Extended Unix Coding) care sunt folosite pentru cel
Japonez şi Corean (şi a celui Chinez de mărime mai mică) a creat şi mai multă
confuzie, în timp ce sistemele de operare foloseau diferite seturi de caractere
pentru acelaşi limbaj, de exemplu, Shift-JIS şi ISO-2022-JP. Utilizatorii care
doreau să vadă simbolurile chirilice aveau de ales între KOI8-R pentru cele
ruseşti şi bulgăreşti sau KOI8-U pentru cele ucrainiene, sau între celelalte
codări chirilice cum ar fi insuccesul ISO 8859-5, şi setul comun Windows-1251.
Toate aceste seturi de caractere rupeau compatibilitatea cu ASCII (cu toate că
codarea KOI8 plasa caracterele chirilice în ordinea latină, deci în caz că nu se
foloseşte al optulea bit, textul se poate citi pe un terminal ASCII.)
</p>
<p>
Asta a adus la confuzie, şi la inabilitatea unei comunicări în mai multe limbi,
în special între mai multe alfabete. Intraţi în Unicode.
</p>
</body>
</section>
<section>
<title>Ce Este Unicode?</title>
<body>
<p>
Unicode elimină tradiţionala limită a unui singur octet pentru setul de
caractere. Foloseşte 17 "planuri" de 65,536 puncte de cod pentru a descrie un
maxim de 1,114,112 caractere. Primul plan, cunoscut şi ca "Basic Multilingual
Plane" (Planul de Bază Multi-lingv) sau BMP, conţine aproape tot ce vom folosi
vreodată, mulţi au făcut presupunerea greşită că Unicode foloseşte un set de
caractere pe 16 biţi.
</p>
<p>
Unicode a fost reprezentat în diferite moduri, dar două dintre cele mai comune
sunt <b>UTF</b> (Unicode Transformation Format - Formatul de Transformare
Unicode) şi <b>UCS</b> (Universal Character Set - Setul de Caractere
Universale). Un număr după UTF indică numărul de biţi într-o unitate, în timp
ce numărul de după UCS indică numărul de octeţi. UTF-8 a devenit cel mai
răspândit pentru schimbarea de text Unicode datorită naturii sale simple pe opt
biţi, şi este subiectul acestui document.
</p>
</body>
</section>
<section>
<title>UTF-8</title>
<body>
<p>
UTF-8 este o codare de caractere de lungime variabilă, ceea ce înseamă că
foloseşte pentru fiecare simbol de la 1 la 4 octeţi. Deci, primul octet UTF-8
este folosit pentru codarea ASCII. UTF-8 înseamnă că caracterele ASCII şi
latine pot fi combinate cu o mică creştere a dimensiunii datelor, deoarece e
folosit numai primul bit. Utilizatorii alfabetelor estice cum ar fi cel
Japonez, cui i-a fost repartiţionat o porţiune mai mare de octeţi sunt
nefericiţi, deoarece are ca rezultat 50% de date redundante.
</p>
</body>
</section>
<section>
<title>Ce Poate Face UTF-8 pentru Dumneavoastră</title>
<body>
<p>
UTF-8 vă permite să lucraţi într-un mediu care respectă standardele, este
internaţional acceptat şi puteţi folosi mai multe limbi, cu irosire mică de
date. UTF-8 este metoda preferată pentru a transmite caractere non-ASCII pe
Internet, prin poşta electronică, IRC sau oricare alt mediu. Cu toate astea,
multă lume se comportă cu ostilitate la folosirea UTF-8 pentru comunicaţii
online. Este bine să cunoaşteţi atitudinea privind UTF-8 într-un anume canal,
listă de discuţii sau grup Usenet înainte să utilizaţi <e>non-ASCII</e> UTF-8.
</p>
</body>
</section>
</chapter>
<chapter>
<title>Setarea UTF-8 în Gentoo Linux</title>
<section>
<title>Căutarea şi Crearea Localizărilor UTF-8</title>
<body>
<p>
Acum, că înţelegeţi principiile ce stau la baza Unicode, sunteţi pregătit
pentru a începe folosirea UTF-8 în sistemul dumneavoastră.
</p>
<p>
Necesitatea prelimininară pentru UTF-8 este să aveţi instalată o versiune de
glibc care are suport pentru limbile naţionale. Recomandarea este să faceţi
asta în fişierul <path>/etc/locales.build</path> în combinaţie cu indicatorul
USE <c>userlocales</c>. Nu este scopul acestui document de a explica folosirea
acestui fişier, care este bine documentat în comentariile din interiorul lui.
Este de asemenea explicat în <uri
link="/doc/ro/guide-localization.xml#doc_chap3_sect3">Ghidul de Localizare
Gentoo</uri>.
</p>
<p>
Acum urmează să decidem dacă o localizare UTF-8 este disponibilă pentru limba
dumneavoastră, sau să creaţi una.
</p>
<pre caption="Verificarea unei localizări UTF-8 existente">
<comment>(Înlocuiţi "en_GB" cu setarea localizării dorite)</comment>
# <i>locale -a | grep 'en_GB'</i>
en_GB
en_GB.UTF-8
</pre>
<p>
Din ieşirea acestei comenzi, trebuie să luam rezultatul cu un sufix asemănător
cu <c>.UTF8</c>. Dacă nu este nici un rezultat cu un sufix asemănător cu
<c>.UTF8</c>, trebuie să creăm o localizare compatibilă UTF-8.
</p>
<note>
Executaţi următorul cod numai dacă nu aveţi o localizare UTF-8 disponibilă
pentru limba dumneavoastră.
</note>
<pre caption="Crearea unei localizări UTF-8">
<comment>(Înlocuiţi "en_GB" cu setarea localei dorite)</comment>
# <i>localedef -i en_GB -f UTF-8 en_GB.UTF8</i>
</pre>
<p>
Altă metodă de a adăuga o localizare UTF-8 este să o adăugaţi în fişierul
<path>/etc/locales.build</path> şi să recompilaţi <c>glibc</c> cu indicatorul
USE <c>userlocales</c> activat.
</p>
<pre caption="Linie în /etc/locales.build">
en_GB.UTF-8/UTF-8
</pre>
</body>
</section>
<section>
<title>Setarea Localizării</title>
<body>
<p>
Există o variabilă de mediu ce trebuie setată pentru utiliza noile noastre
localizări UTF-8: <c>LC_ALL</c> (această variabilă suprascrie şi setarea
<c>LANG</c>). Există, de asemenea, multe moduri de a le seta; unii utilizatori
preferă să aibă un mediu UTF-8 doar pentru un anume utilizator, caz în care le
pot seta în fişierele <path>~/.profile</path> (dacă utilizaţi <c>/bin/sh</c>),
<path>~/.bash_profile</path> sau <path>~/.bashrc</path> (dacă utilizaţi
<c>/bin/bash</c>).
</p>
<p>
Alţii preferă să seteze localizările global. O circumstanţă specifică pe care
autorul o recomandă în special, este când script-ul
<path>/etc/init.d/xdm</path> este încărcat, pentru că acest script de
iniţializare porneşte managerul grafic şi aplicaţia desktop înainte ca
fişierele de shell menţionate anterior să fie încărcate, şi deci, înainte ca
aceste variabile să fie prezente în mediu.
</p>
<p>
Setarea localizării generic ar trebui să fie efectuată prin utilizarea
<path>/etc/env.d/02locale</path>. Fişierul ar trebui să aibă un conţinut similar
cu următorul:
</p>
<pre caption="Demonstraţie pentru /etc/env.d/02locale">
<comment>(Ca întotdeauna, modificaţi "en_GB.UTF-8" cu localizarea dvs.)</comment>
LC_ALL="en_GB.UTF-8"
</pre>
<p>
Apoi, mediul trebuie actualizat pentru a încărca modificarea.
</p>
<pre caption="Actualizarea mediului">
# <i>env-update</i>
>>> Regenerating /etc/ld.so.cache...
* Caching service dependencies ...
# <i>source /etc/profile</i>
</pre>
<p>
Acum, rulaţi <c>locale</c> fără nici un argument, pentru a vedea dacă avem
variabilele corecte în mediul nostru:
</p>
<pre caption="Verificarea dacă noua noastră localizare se află în mediu">
# <i>locale</i>
LANG=
LC_CTYPE="en_GB.UTF-8"
LC_NUMERIC="en_GB.UTF-8"
LC_TIME="en_GB.UTF-8"
LC_COLLATE="en_GB.UTF-8"
LC_MONETARY="en_GB.UTF-8"
LC_MESSAGES="en_GB.UTF-8"
LC_PAPER="en_GB.UTF-8"
LC_NAME="en_GB.UTF-8"
LC_ADDRESS="en_GB.UTF-8"
LC_TELEPHONE="en_GB.UTF-8"
LC_MEASUREMENT="en_GB.UTF-8"
LC_IDENTIFICATION="en_GB.UTF-8"
LC_ALL=en_GB.UTF-8
</pre>
<p>
Asta este tot. Utilizaţi, acum, localizări UTF-8, şi următorul pas este
configurarea aplicaţiilor ce le utilizaţi zilnic.
</p>
</body>
</section>
</chapter>
<chapter>
<title>Suportul Aplicaţie</title>
<section>
<body>
<p>
Când Unicode a început să devină popular în lumea software, seturile de
caractere multioctet nu se potriveau la limbaje ca C, în care erau scrise mai
toate programele din acea perioadă. Chiar astăzi, anumite programe nu se
descurcă bine cu UTF-8. Din fericire, cele mai multe se descurcă.
</p>
</body>
</section>
<section>
<title>Numele Fişierelor, NTFS şi FAT</title>
<body>
<p>
Sunt mai multe opţiuni pentru NLS în meniul de configurare al kernel-ului Linux,
dar este important să nu devenim confuzi! În cea mai mare parte, singurul lucru
care trebuie să îl facem este să activăm suportul NLS pentru UTF-8 în kernel,
şi să schimbăm modul NLS implicit în utf8.
</p>
<pre caption="Paşii de configurare pentru UTF-8 NLS în kernel">
File Systems -->
Native Language Support -->
(utf8) Default NLS Option
<*> NLS UTF8
<comment>(De asemenea bifaţi <*> pentru alte seturi de caractere care sunt
folosite de FAT şi de mediile CDROM Joilet.)</comment>
</pre>
<p>
Dacă aveţi de gând să mount-aţi partiţii NTFS, trebuie să
specificaţi opţiunea <c>nls=</c> la mount-are. Dacă aveţi de gând să
utilizaţi partiţii FAT, este posibil să trebuiască să specificaţi o
opţiune <c>codepage=</c> pentru comanda mount. Opţional, puteţi de asemenea
să setaţi o pagină de coduri implicită pentru FAT în configurarea
kernel-ului dvs. Notaţi faptul că opţiunea <c>codepage</c> pentru mount, va
suprascrie setările de kernel.
</p>
<pre caption="Setări FAT în configuraţia de kernel">
File Systems -->
DOS/FAT/NT Filesystems -->
(437) Default codepage for fat
</pre>
<p>
Ar trebui să evitaţi utilizarea opţiunii <c>Default iocharset for fat</c>
cu valoarea UTF-8, doarece nu este recomandată. În loc, puteţi pasa
opţiunea utf8=true la mount-area partiţiilor dvs. FAT. Pentru mai multe
informaţii, consultaţi <c>man mount</c> şi documentaţia de kernel din
<path>/usr/src/linux/Documentation/filesystems/vfat.txt</path>.
</p>
<p>
Pentru a schimba codarea numelor la fişiere, puteţi folosi <c>app-text/convmv</c>.
</p>
<pre caption="Exemplu de folosire al convmv">
# <i>emerge --ask app-text/convmv</i>
<comment>(Formatul comenzii)</comment>
# <i>convmv -f <encodare-curentă> -t utf-8 <nume-fişier></i>
<comment>(Înlocuiţi iso-8859-1 cu setul de caractere de la care convertiţi)</comment>
# <i>convmv -f iso-8859-1 -t utf-8 nume-fisier</i>
</pre>
<p>
Pentru a schimba <e>conţinutul</e> fişierelor, folosiţi utilitarul
<c>iconv</c>, inclus în <c>glibc</c>:
</p>
<pre caption="Exemplu de folosire al iconv">
<comment>(înlocuiţi iso-8859-1 cu setul de caractere de la care convertiţi)</comment>
<comment>(Verificaţi dacă rezultatul este normal)</comment>
# <i>iconv -f iso-8859-1 -t utf-8 nume_fisier</i>
<comment>(Convertiţi un fişier, trebuie să creaţi alt fişier)</comment>
# <i>iconv -f iso-8859-1 -t utf-8 nume_fisier > fisier_nou</i>
</pre>
<p>
Pentru acest lucru poate fi folosit şi <c>app-text/recode</c>.
</p>
</body>
</section>
<section>
<title>Consola Sistemului</title>
<body>
<impo>
Aveţi nevoie de >=sys-apps/baselayout-1.11.9 pentru a putea folosi Unicode în
consolă.
</impo>
<p>
Pentru a activa UTF-8 în consolă, trebuie să editaţi <path>/etc/rc.conf</path>
şi să setaţi <c>UNICODE="yes"</c>, de asemenea să citiţi comentariile în acel
fişier -- este important să aveţi un font care are o plajă mare de caractere
dacă intenţionaţi să folosiţi totul din Unicode.
</p>
<p>
Variabila <c>KEYMAP</c> setată în <path>/etc/conf.d/keymaps</path>, ar trebui
să aibă o definiţie de dispunere a tastelor specifică Unicode.
</p>
<pre caption="Exemplu de folosire /etc/conf.d/keymaps">
<comment>(Schimbaţi "uk" cu dispunerea dumneavoastră locală)</comment>
KEYMAP="uk"
</pre>
</body>
</section>
<section>
<title>Ncurses şi Slang</title>
<body>
<note>
Ignoraţi orice menţionare de Slang în această secţiune dacă nu îl aveţi
instalat sau dacă nu îl folosiţi.
</note>
<p>
Este indicat să adăugaţi <c>unicode</c> între indicatorii USE globali din
<path>/etc/make.conf</path>, după care să efectuaţi din nou emerge pentru
<c>sys-libs/ncurses</c> şi <c>sys-libs/slang</c>, dacă este nevoie. Portage
va efectua acest lucru când vă veţi actualiza sistemul:
</p>
<pre caption="Updating your system">
# <i>emerge --update --deep --newuse world</i>
</pre>
<p>
Trebuie de asemenea să recompilăm pachetele care se leagă de ele, acum că
schimbările de la USE au avut loc. Instrumentul care îl folosim
(<c>revdep-rebuild</c>) face parte din pachetul <c>gentoolkit</c>.
</p>
<pre caption="Recompilarea programelor care se leagă de ncurses sau slang">
# <i>revdep-rebuild --soname libncurses.so.5</i>
# <i>revdep-rebuild --soname libslang.so.1</i>
</pre>
</body>
</section>
<section>
<title>KDE, GNOME şi Xfce</title>
<body>
<p>
Majoritatea mediilor desktop suportă în întregime Unicode, şi nu necesită alte
setări care nu au fost acoperite de acest ghid. Asta din cauză că toolkit-urile
grafice care sunt folosite (QT şi GTK+2) au suport pentru UTF-8. În consecinţă,
toate aplicaţiile care rulează cu aceste toolkit-uri ar trebui să funcţioneze
cu UTF-8 fără setări suplimentare.
</p>
<p>
Excepţia la această regulă este în Xlib şi GTK+1. GTK+1 necesită o setare
FontSpec iso-10646-1 în ~/.gtkrc, de exemplu
<c>-misc-fixed-*-*-*-*-*-*-*-*-*-*-iso10646-1</c>. De asemenea, aplicaţiile
care folosesc Xlib sau Xaw au nevoie să fie specificat o setare FontSpec
asemănătoare, altfel ele nu vor funcţiona.
</p>
<note>
Dacă aveţi o versiune de gnome1 control center instalat, folosiţi-l pentru a
seta de acolo. Alegeţi oricare font iso10646-1 de acolo.
</note>
<pre caption="Exemplu ~/.gtkrc (pentru GTK+1) care defineşte un font compatibil Unicode">
style "user-font"
{
fontset="-misc-fixed-*-*-*-*-*-*-*-*-*-*-iso10646-1"
}
widget_class "*" style "user-font"
</pre>
<p>
Dacă o aplicaţie are suport pentru interfaţă grafică QT cât şi GTK+2, interfaţa
grafică GTK+2 va da în general rezultate mai bune dacă se foloseşte Unicode.
</p>
</body>
</section>
<section>
<title>X11 şi Fonturile</title>
<body>
<impo>
<c>x11-base/xorg-x11</c> are suport mai bun Unicode decât XFree86 şi este
<e>foarte</e> recomandat.
</impo>
<p>
Fonturile TrueType suportă Unicode, şi majoritatea fonturilor care sunt
distribuite cu Xorg au un foarte bun suport de caractere, cu toate, că nu
fiecare simbol disponibil în Unicode a fost creat pentru acel font. Pentru a
avea fonturi(inclusiv setul Bitstream Vera) cu suportul pentru literele
est-asiatice şi X, asiguraţi-vă că aţi setat indicatorul USE <c>cjk</c>. Multe
alte aplicaţii folosesc acest indicator, deci merită să îl adăugaţi ca un
indicator USE permanent.
</p>
<p>
De asemenea mai multe fonturi din Portage au suport pentru Unicode.
</p>
<pre caption="Opţional: Instalaţi câteva fonturi care au suport Unicode">
# <i>emerge terminus-font intlfonts freefonts cronyx-fonts corefonts</i>
</pre>
</body>
</section>
<section>
<title>Managerii de Ferestre şi Emulatoarele de Terminal</title>
<body>
<p>
Managerii de ferestre care nu sunt realizate cu GTK sau QT au în general bun
suport Unicode, deoarece folosesc librăria Xft pentru manipularea fonturilor.
Dacă managerul dumneavoastră de ferestre nu foloseşte Xft pentru fonturi,
puteţi utiliza setarea FontSpec menţionată în secţiunea anterioară ca font
Unicode.
</p>
<p>
Emulatoarele de terminal care folosesc Xft şi suportă Unicode sunt mai greu
de găsit. În afară de Konsole şi Gnome-Terminal, cele mai bune opţiuni
în Portage sunt <c>x11-terms/rxvt-unicode</c>, <c>xfce-extra/terminal</c>,
<c>gnustep-apps/terminal</c>, <c>x11-terms/mlterm</c> sau
<c>x11-terms/xterm</c> când este compilat cu indicatorul USE <c>unicode</c>
şi pornit ca <c>uxterm</c>. <c>app-misc/screen</c> suportă de asemenea
UTF-8, când este pornit ca <c>screen -U</c> sau este adăugătă în
<path>~/.screenrc</path> următoarea linie:
</p>
<pre caption="~/.screenrc pentru UTF-8">
defutf8 on
</pre>
</body>
</section>
<section>
<title>Vim, Emacs, Xemacs şi Nano</title>
<body>
<p>
Vim are suport complet pentru UTF-8, de asemenea detectează automat fişierele
UTF-8. Pentru mai multe informaţii în Vim, folosiţi <c>:help mbyte.txt</c>.
</p>
<p>
Emacs 22.x sau versiunile mai noi are suport complet UTF-8, de asemenea. Xemacs
22.x nu suportă caracterele mixte, încă.
</p>
<p>
Versiunile mai vechi de Emacs şi/sau Xemacs ar putea să necesite instalarea
<c>app-emacs/mule-ucs</c> şi/sau <c>app-xemacs/mule-ucs</c> şi adăugarea
următorului cod în fişierul dvs. <path>~/.emacs</path> pentru a avea suport
pentru limbile CJK în UTF-8:
</p>
<pre caption="Suportul CJK UTF-8 în Emacs">
(require 'un-define)
(require 'jisx0213)
(set-language-environment "Japanese")
(set-default-coding-systems 'utf-8)
(set-terminal-coding-system 'utf-8)
</pre>
<p>
Nano oferă suport complet pentru UTF-8 de la versiunea 1.3.6.
</p>
</body>
</section>
<section>
<title>Aplicaţii Shell</title>
<body>
<p>
Momentan, <c>bash</c> are suport complet pentru Unicode prin librăria GNU
readline. Aplicaţia Z Shell stă foarte prost la acest lucru, nici o porţiune
din shell nu are suport Unicode, cu toate că este concentrat un efort pentru a
adăuga suport pentru setul de caractere multioctet.
</p>
<p>
Aplicaţia C Shell, <c>tcsh</c> şi <c>ksh</c> nu au deloc suport UTF-8.
</p>
</body>
</section>
<section>
<title>Irssi</title>
<body>
<p>
Irssi are suport complet pentru UTF-8, cu toate că este necesară setarea unei
opţiuni.
</p>
<pre caption="Activarea UTF-8 în Irssi">
/set term_charset UTF-8
</pre>
<p>
Pentru canale unde caractere non-ASCII sunt folosite des în seturi de caractere
non-UTF-8, comanda <c>/recode</c> poate fi folosită pentru a converti
caracterele. Scrieţi <c>/help recode</c> pentru mai multe informaţii.
</p>
</body>
</section>
<section>
<title>Mutt</title>
<body>
<p>
Agentul de mesagerie electronică Mutt are suport foarte bun pentru Unicode.
Pentru a folosi Mutt cu UTF-8, nu trebuie să modificaţi deloc fişierele dvs. de
configurare. Mutt va funcţiona într-un mediu unicode dacă toate fişierele dvs.
de configurare (incluzând semnătura) sunt encodate UTF-8.
</p>
<note>
Încă puteţi folosi '?' în timp ce citiţi mailurile. Acest lucru apare de la
faptul că persoanele folosesc un client de mail care nu specifică setul de
caractere folosit. Nu puteţi face mare lucru decât să cereţi persoanelor să îşi
configureze corespunzător clientul de mail.
</note>
<p>
Mai multe informaţii găsiţi pe pagina <uri
link="http://wiki.mutt.org/index.cgi?MuttFaq/Charset">Mutt Wiki</uri>.
</p>
</body>
</section>
<section>
<title>Less</title>
<body>
<p>
Cu toţii utilizăm mult <c>more</c> sau <c>less</c> alături de caracterul
<c>|</c> pentru a putea să observăm corect ceea ce afişează o comandă, cum ar
fi spre exemplu, <c>dmesg | less</c>. În timp <c>more</c> are nevoie doar ca
aplicaţia shell să ştie codarea UTF-8, <c>less</c> are nevoie de o variabilă
de mediu setată, <c>LESSCHARSET</c> pentru a vă asigura afişarea corectă a
caracterelor. Aceasta poate fi setată în <path>/etc/profile</path> sau
<path>~/.bash_profile</path>. Deschideţi editorul preferat şi adăugaţi
următoarea linie într-unul dintre fişierele menţionate anterior.
</p>
<pre caption="Setarea variabilei de mediu pentru less">
LESSCHARSET=utf-8
</pre>
</body>
</section>
<section>
<title>Man</title>
<body>
<p>
Paginile de manual sunt o parte integrală a unei maşini Linux. Pentru a vă
asigura că textul unicode este afişat corect în paginile dvs. de manual,
editaţi <path>/etc/man.conf</path> şi înlocuiţi o linie, după cum urmează.
</p>
<pre caption="modificările din man.conf pentru suportul Unicode">
<comment>(Aceasta este linia anterioară)</comment>
NROFF /usr/bin/nroff -Tascii -c -mandoc
<comment>(Înlocuiţi linia de mai sus cu aceasta)</comment>
NROFF /usr/bin/nroff -mandoc -c
</pre>
</body>
</section>
<section>
<title>elinks şi links</title>
<body>
<p>
Acestea sunt cele mai utilizate aplicaţii browser în mod text, şi vom vedea
cum să le activăm suportul UTF-8. Pentru <c>elinks</c> şi <c>links</c>,
există două modalităţi de a efectua această operaţie, una fiind
utilizarea opţiunii Setup din browser sau prin editarea fişierului de
configurare. Pentru a seta opţiunea prin intermediul aplicaţiei browser,
deschideţi o pagină cu <c>elinks</c> sau <c>links</c> şi apoi apăsaţi
<c>Alt+S</c> pentru a intra în meniul Setup, apoi selectaţi Terminal options
sau apăsaţi <c>T</c>. Derulaţi în jos şi selectaţi ultima opţiune
<c>UTF-8 I/O</c> prin apăsarea tastei Enter. Apoi, salvaţi şi ieşiţi
din meniu. Pentru <c>links</c> este posibil să trebuiască repetarea
apăsarii <c>Alt+S</c> şi apoi apăsarea tastei <c>S</c> pentru salvare.
Opţiunea pentru fişierul de configurare este descrisă mai jos.
</p>
<pre caption="Activarea UTF-8 pentru elinks/links">
<comment>(Pentru elinks, editaţi /etc/elinks/elinks.conf sau ~/.elinks/elinks.conf şi
adăugaţi următoarea linie)</comment>
set terminal.linux.utf_8_io = 1
<comment>(Pentru links, editaţi ~/.links/links.cfg şi adăugaţi următoarea linie</comment>
terminal "xterm" 0 1 0 us-ascii utf-8
</pre>
</body>
</section>
<section>
<title>Testarea Funcţionalităţii</title>
<body>
<p>
Sunt multe site-uri cu teste pentru UTF-8.<c>net-www/w3m</c>,
<c>net-www/links</c>, <c>net-www/elinks</c>, <c>net-www/lynx</c> şi toate
navigatoarele bazate pe Mozilla (inclusiv Firefox) suportă UTF-8. Konqueror şi
Opera suportă de asemenea UTF-8, în totalitate.
</p>
<p>
Când folosiţi navigatoarele în mod text, asiguraţi-vă că folosiţi un terminal
care are suport pentru Unicode.
</p>
<p>
Dacă vedeţi anumite caractere afişate ca pătrate cu litere sau numere înăuntru,
asta înseamnă că fontul dumneavoastră nu are caracter pentru simbolul care îl
doreşte UTF-8. În schimb, afişează un pătrat cu codul hexazecimal al simbolului
UTF-8.
</p>
<ul>
<li>
<uri link="http://www.w3.org/2001/06/utf-8-test/UTF-8-demo.html">o pagină
de test UTF-8</uri>
</li>
<li>
<uri
link="http://titus.uni-frankfurt.de/indexe.htm?/unicode/unitest.htm">Pagină
de test pusă la dispoziţie de Universitatea din Frankfurt</uri>
</li>
</ul>
</body>
</section>
<section>
<title>Metode de intrare</title>
<body>
<p>
<e>Tastele inactive</e> pot fi folosite pentru caracterele de intrare în X care
nu sunt incluse în tastatura dumneavoastră. Acestea funcţionează la apăsarea
tastei ALT stânga (sau în anumite ţări, AltGr) şi o tastă opţională din
secţiunea non-alfabetică a tastaturii din stânga butonului enter, eliberaţi-o,
apoi apăsaţi o literă. Tasta inactivă ar trebui să o modifice. Intrarea mai
poate fi modificată folosind tasta Shift în acelaşi timp cu tasta AltGr şi
modificatorul.
</p>
<p>
Pentru a activa tastele inactive în X, trebuie să aveţi o definiţie de
dispunere care le suportă. Majoritatea definiţiilor de dispunere Europene au
taste inactive în configuraţia implicită. Cu toate astea, nu este aplicabil
pentru definiţiile de dispunere nord-americane. Cu toate că definiţiile de
dispunere sunt destul de inconsistente, cea mai uşoară soluţie este să folosiţi
o definiţie de forma "en_US" şi nu "us". Definiţia de dispunere este setată în
<path>/etc/X11/xorg.conf</path> în felul următor:
</p>
<pre caption="/etc/X11/xorg.conf snippet">
Section "InputDevice"
Identifier "Keyboard0"
Driver "kbd"
Option "XkbLayout" "en_US" <comment># În loc de numai "us"</comment>
<comment>(Alte opţiuni pentru Xkb)</comment>
EndSection
</pre>
<note>
Schimbările anterioare trebuie aplicate numai dacă folosiţi un o definiţie de
dispunere nord-americană, sau altă dispunere unde tastele inactive nu
funcţionează. Utilizatorii europeni vor avea tastele inactive funcţionale.
</note>
<p>
Această schimbare va avea efect după ce serverul X a fost repornit. Pentru a
aplica schimbările imediat, folosiţi utilitarul <c>setxkbmap</c>, de exemplu,
<c>setxkbmap en_US</c>.
</p>
<p>
Probabil este mai uşor dacă descriem tastele inactive prin exemple. Cu toate că
rezultatele sunt locale, conceptul ar trebui să rămână acelaşi indiferent de
localizare. Exemplele conţin UTF-8, aşa că pentru a le vedea trebuie să îi
specificaţi navigatorului să vizualizeze pagina ca UTF-8, sau să aveţi deja
configurată o localizare UTF-8.
</p>
<p>
După ce apăsaţi AltGr şi [, eliberaţi-le, după care apăsaţi a, 'ä' este scris.
Când apăsaţi AltGr şi ], după care apăsaţi e, 'ë' este scris. Când apăsaţi
AltGr şi ;, 'á' este scris, şi când apăsaţi AltGr şi ;, 'é' este scris.
</p>
<p>
Apăsând AltGr, Shift şi [, după care le eliberaţi, şi apoi apăsaţi a, este
scris caracterul scandinav 'å'. Similar, când apăsaţi AltGr, Shift şi [,
eliberaţi <e>numai</e> şi apoi apăsaţi-l din nou, caracterul '˚' este scris. Cu
toate că seamănă între ele, acesta (U+02DA) nu este la fel cu simbolul pentru
grad (U+00B0). Aceasta funcţionează şi pentru alte caractere accentuate produse
de cheile moarte - AltGr şi [, eliberând numai [, apoi apăsându-l din nou este
scris '¨'.
</p>
<p>
AltGr poate fi folosit singur şi cu tastele alfabetice. De exemplu, AltGr şi m,
este scris litera mică greacă miu: 'µ'. AltGr şi s produce un caracter scharfes
s sau esszet: 'ß'. Aşa cum mulţi utilizatori europeni se aşteaptă (pentru că
este marcat pe tastatura acestora), AltGr şi 4 (sau E, depinzând de dispunerea
tastaturii dvs.) produce un semn Euro, '€'.
</p>
</body>
</section>
<section>
<title>Resurse</title>
<body>
<ul>
<li>
<uri link="http://en.wikipedia.com/wiki/Unicode">Intrarea Wikipedia pentru
Unicode</uri>
</li>
<li>
<uri link="http://en.wikipedia.com/wiki/UTF-8">Intrarea Wikipedia pentru
UTF-8</uri>
</li>
<li><uri link="http://www.unicode.org">Unicode.org</uri></li>
<li><uri link="http://www.utf-8.com">UTF-8.com</uri></li>
<li><uri link="http://www.ietf.org/rfc/rfc3629.txt">RFC 3629</uri></li>
<li><uri link="http://www.ietf.org/rfc/rfc2277.txt">RFC 2277</uri></li>
<li>
<uri link="http://www.tbray.org/ongoing/When/200x/2003/04/26/UTF">Caractere
vs. octeţi</uri>
</li>
</ul>
</body>
</section>
</chapter>
</guide>
|