* * * *

Privacy Policy

Blog italiano

Clicca qui se vuoi andare al blog italiano su Lazarus e il pascal.

Forum ufficiale

Se non siete riusciti a reperire l'informazione che cercavate nei nostri articoli o sul nostro forum vi consiglio di visitare il
Forum ufficiale di Lazarus in lingua inglese.

Lazarus 1.0

Trascinare un file nel programma
DB concetti fondamentali e ZeosLib
Recuperare codice HTML da pagina web
Mandare mail con Lazarus
Stabilire il sistema operativo
Esempio lista in pascal
File INI
Codice di attivazione
Realizzare programmi multilingua
Lavorare con le directory
Utilizzare Unità esterne
TTreeView
TTreeview e Menu
Generare controlli RUN-TIME
LazReport, PDF ed immagini
Intercettare tasti premuti
Ampliare Lazarus
Lazarus e la crittografia
System Tray con Lazarus
UIB: Unified Interbase
Il file: questo sconosciuto
Conferma di chiusura di un applicazione
Liste e puntatori
Overload di funzioni
Funzioni a parametri variabili
Proprietà
Conversione numerica
TImage su Form e Panel
Indy gestiore server FTP lato Client
PopUpMenu sotto Pulsante (TSpeedButton)
Direttiva $macro
Toolbar
Evidenziare voci TreeView
Visualizzare un file Html esterno
StatusBar - aggirare l'errore variabile duplicata
Da DataSource a Excel
Le permutazioni
Brute force
Indy 10 - Invio email con allegati
La gestione degli errori in Lazarus
Pascal Script
Linux + Zeos + Firebird
Dataset virtuale
Overload di operatori
Lavorare con file in formato JSON con Lazarus
Zeos ... dietro le quinte (prima parte)
Disporre le finestre in un blocco unico (come Delphi)
Aspetto retrò (Cmd Line)
Lazarus 1.0
Come interfacciare periferica twain
Ubuntu - aggiornare free pascal e lazarus
fpcup: installazioni parallele di lazarus e fpc
Free Pascal e Lazarus sul Raspberry Pi
Cifratura: breve guida all'uso dell'algoritmo BlowFish con lazarus e free pascal.
Creare un server multithread
guida all'installazione di fpc trunk da subversion in linux gentoo
Indice
DB concetti fondamentali e connessioni standard
Advanced Record Syntax
DB concetti fondamentali e DBGrid
DB concetti fondamentali e TDBEdit, TDBMemo e TDBText
Advanced Record Syntax: un esempio pratico
Superclasse form base per programmi gestionali (e non)
Superclasse form base per programmi gestionali (e non) #2 - log, exception call stack, application toolbox
Superclasse form base per programmi gestionali (e non) #3 - traduzione delle form
Superclasse form base per programmi gestionali (e non) #4 - wait animation
Un dialog per la connessione al database:TfmSimpleDbConnectionDialog
Installare lazarus su mac osx sierra
immagine docker per lavorare con lazarus e free pascal
TDD o Test-Driven Development
Benvenuto! Effettua l'accesso oppure registrati.
Maggio 04, 2024, 11:04:21 am

Inserisci il nome utente, la password e la durata della sessione.

124 Visitatori, 0 Utenti

Autore Topic: Lo strano caso delle vocali accentate  (Letto 455 volte)

AlexLazarus

  • Jr. Member
  • **
  • Post: 91
  • Karma: +1/-0
Lo strano caso delle vocali accentate
« il: Dicembre 20, 2022, 11:28:16 am »
Forse ho scoperto l'acqua calda, ma vorrei sottoporre ai più esperti una scoperta che ritengo interessante.

Dunque...
Nei miei Video Tutorial per principianti (N. 180 e 190) descrivo il funzionamento di un programma (ZIP liberamente scaricabile dal canale) che, per farla breve, compie le seguenti operazioni:
1) Carica un file (precedentemente suddiviso in tante righe quante sono le parole)
2) Da ogni singola parola elimina tutti i caratteri, ad eccezione di quelli alfabetici (comprese vocali accentate).
3) Elimina tutte le parole ripetute più di una volta.

Ora succede che (vedi figura 1) se le parole che contengono un accento sono scritte con BLOCCO NOTE (di Windows), le vocali accentate vengono riconosciute come caratteri validi e, come tali, accettati.

Se invece (vedi Figura 2) lo stesso testo lo scrivo in LibreOffice (e lo salvo ovviamente in formato TXT), le vocali accentate NON vengono riconosciute e quidi rimosse dalle parole.

Dopo aver fatto numerosi tentativi, ho trovato una soluzione (Figura 3) per ottenere - da LIBREOFFICE - un file TXT in cui è possibile individuare (e accettare) le vocali accentate:

A) Da LibreOffice salvare il file in formato HTML
B) Caricare in Chrome il file ottenuto
C) Selezionare l'intero testo e fare Copia con il solito Control + C
D) Aprire BloccoNote (cioè un file "vuoto"), incollare il testo con Control + V e salvarlo.
E) A questo punto il file è correttamente interpretato dal mio programma.

Conclusione(?):

Evidentemente il formato TXT che utilizza LibreOffice non è "universale" (a differenza di quello correttamente riconosciuto da NotePad e Chrome) e richiede quindi una conversione... già: ma quale conversione?
Oppure...?


P.S. I file non avevano ancora subito al conversione maiuscolo / minuscolo e quindi le maiuscole risultano soppresse. Inoltre non ho eliminato l'apostrofo... Va be', però il concetto è chiaro. 😉
« Ultima modifica: Dicembre 20, 2022, 11:30:50 am da AlexLazarus »

DragoRosso

  • Scrittore
  • Hero Member
  • *****
  • Post: 1268
  • Karma: +43/-0
  • Prima ascoltare, poi decidere
Re:Lo strano caso delle vocali accentate
« Risposta #1 il: Dicembre 20, 2022, 12:09:45 pm »
Su questo se cerchi ci sono diverse indicazioni e approfondimenti nei vari topic e discussioni del forum.

In breve (per non ritornare a ritrattare tutto), il formato TXT standard non può essere universale perchè genericamente dovrebbe contenere solo i caratteri  da 0 a 127 ASCII.

Se il TXT ha una BOM, allora è possibile riconoscere in automatico la codifica del testo.

In alternativa è necessario concordare tra chi scrive e chi legge il formato di codifica dei caratteri.

Normalmente per scrivere i caratteri diversi dai caratteri standard dell'alfabeto inglese (tipo lettere accentate italiane) viene usato il formato UTF-8.

Nel web, nel XML, ....., è tutto codificato UTF-8.

Cerca nel forum e vedi le discussioni, sono abbastanza esaurienti.

Ciao
:) Ogni alba è un regalo, ogni tramonto è una conquista :)

nomorelogic

  • Global Moderator
  • Hero Member
  • *****
  • Post: 2873
  • Karma: +20/-4
Re:Lo strano caso delle vocali accentate
« Risposta #2 il: Dicembre 20, 2022, 12:25:24 pm »
LibreOffice salva il testo in UTF-8 con BOM.
Per apprezzare le differenze dovresti aprire i 2 file di testo (quello creato con LibreOffice e quello creato con semplice editor di testi) con un editor esadecimale.

Vedrai che il contenuto in byte è diverso (soprattutto il primo byte).
Poi se vuoi approfondire, come dice DragoRosso, ci sono molti thread in giro.

nomorelogic
Imagination is more important than knowledge (A.Einstein)

AlexLazarus

  • Jr. Member
  • **
  • Post: 91
  • Karma: +1/-0
Re:Lo strano caso delle vocali accentate
« Risposta #3 il: Dicembre 20, 2022, 05:17:38 pm »
Avete (ovviamente) ragione.
Nel frattempo ho esaminato più a fondo (con un mio programma) la questione ed effettivamente le stringhe formate da caratteri accentati risultano lunghe DUE caratteri e non uno.
Comunque mi riprometto di studiare più a fondo ma nel frattempo la soluzione che ho trovato (LibreOffice > HTML > Chrome > Notepad) è più sbrigativa e - ciò che più conta - funziona senza creare particolari stress.
Grazie per i suggerimenti.

 

Recenti

How To

Utenti
Stats
  • Post in totale: 18796
  • Topic in totale: 2237
  • Online Today: 538
  • Online Ever: 900
  • (Gennaio 21, 2020, 08:17:49 pm)
Utenti Online
Users: 0
Guests: 124
Total: 124

Disclaimer:

Questo blog non rappresenta una testata giornalistica poiché viene aggiornato senza alcuna periodicità. Non può pertanto considerarsi un prodotto editoriale ai sensi della legge n. 62/2001.