* * * *
18 Visitatori, 0 Utenti

Autore Topic: [Risolto] UInt64  (Letto 102 volte)

Stilgar

  • Global Moderator
  • Hero Member
  • *****
  • Post: 1676
  • Karma: +2/-0
[Risolto] UInt64
« il: Dicembre 05, 2017, 03:43:25 pm »
Ciao.
Questa è l'unità che mi sta facendo impazzire.
Ho ricostruito che i controllo che fallische è :
Codice: [Seleziona]
 if (Boundaries[idx].lower >= codePoint) 
Quello che non ho capito è il motivo per cui il secondo e il terzo test falliscono in quel punto.

Al posto di tradurmi il codepoint con una stringa di 3 caratteri me la converte in 4 caratteri.

Codice: [Seleziona]
unit unicode;

{$mode objfpc}{$H+}

interface

uses
  Classes, SysUtils;

function UnicodeCodePointToUTF8(codePoint :UInt64) :RawByteString;


implementation

//http://www.faqs.org/rfcs/rfc2279.html
function UnicodeCodePointToUTF8(codePoint :UInt64) :RawByteString;
type
  TBoundary = record
    lower :UInt64;
    upper :UInt64;
    mask :byte;
    len :byte;
  end;

  {
    0000 0000-0000 007F   0xxxxxxx
    0000 0080-0000 07FF   110xxxxx 10xxxxxx
    0000 0800-0000 FFFF   1110xxxx 10xxxxxx 10xxxxxx
    0001 0000-001F FFFF   11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
    0020 0000-03FF FFFF   111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
    0400 0000-7FFF FFFF   1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
 }

const
  Boundaries :array[0..5] of
    TBoundary = (
    (lower :$00000000; upper :$0000007F; mask :$00; len :1),
    (lower :$00000080; upper :$000007FF; mask :$C0; len :2),
    (lower :$00000800; upper :$0000FFFF; mask :$E0; len :3),
    (lower :$00010000; upper :$001FFFFF; mask :$F0; len :4),
    (lower :$00200000; upper :$03FFFFFF; mask :$F8; len :5),
    (lower :$04000000; upper :$7FFFFFFF; mask :$FC; len :6)
    );
var
  ret :array of byte;
  len, mask :word;
  idx :integer;
  sixBits :byte;
begin
  len := Boundaries[0].len;
  for idx := low(Boundaries) to High(Boundaries) do
  begin
    if (Boundaries[idx].lower >= codePoint) and (codePoint <= Boundaries[idx].upper) then
    begin
      mask := Boundaries[idx].mask;
      len  := Boundaries[idx].len;
      break;
    end;
  end;
  SetLength(ret, len);
  for idx := len - 1 downto 1 do
  begin
    sixBits  := codePoint and $3F;
    codePoint := codePoint shr 6;
    ret[idx] := $80 or sixBits;
  end;

  ret[0] := mask or (codePoint and $FF);

  SetLength(Result, Length(ret));
  Move(ret[0], Result[1], length(ret));
end;

procedure selfTest();

  procedure assert(AspectedValue :RawByteString; ReturnedValue :RawByteString; Message :string);
  begin
    if Length(AspectedValue) <> Length(ReturnedValue) then
      raise Exception.CreateFmt('Different Length %s', [Message]);
    if CompareStr(AspectedValue, ReturnedValue) <> 0 then
      raise Exception.CreateFmt('Different Values %s', [Message]);
  end;

begin
  assert(#$e0#$a0#$80, UnicodeCodePointToUTF8($0800), 'Error $0800');
  assert(#$e1#$ad#$bf, UnicodeCodePointToUTF8($1B7F), 'Error $1B7F');
  assert(#$ef#$bf#$bf, UnicodeCodePointToUTF8($FFFF), 'Error $FFFF');

  assert(#$c2#$80, UnicodeCodePointToUTF8($0080), 'Error $0080');
  assert(#$cf#$bf, UnicodeCodePointToUTF8($03FF), 'Error $03FF');
  assert(#$df#$bf, UnicodeCodePointToUTF8($07FF), 'Error $07FF');

  assert(#$00, UnicodeCodePointToUTF8($0000), 'Error $0000');
  assert(#$01, UnicodeCodePointToUTF8($0001), 'Error $0001');
  assert(#$7f, UnicodeCodePointToUTF8($007f), 'Error $007f');
end;


initialization
  selfTest;

end.
« Ultima modifica: Dicembre 05, 2017, 04:02:04 pm da Stilgar »
Al mondo ci sono 10 tipi di persone ... chi capisce il binario e chi no.

Stilgar

  • Global Moderator
  • Hero Member
  • *****
  • Post: 1676
  • Karma: +2/-0
Re:UInt64
« Risposta #1 il: Dicembre 05, 2017, 03:48:20 pm »
Cambiato il test.
Ora funziona. :(

Codice: [Seleziona]
 if (codePoint <= Boundaries[idx].upper) and (Boundaries[idx].upper >= codePoint) then 
   
« Ultima modifica: Dicembre 05, 2017, 04:01:42 pm da Stilgar »
Al mondo ci sono 10 tipi di persone ... chi capisce il binario e chi no.

SB

  • Scrittore
  • Full Member
  • *****
  • Post: 106
  • Karma: +0/-0
Re:[Risolto] UInt64
« Risposta #2 il: Dicembre 10, 2017, 08:35:41 am »
Dovevi scrivere:
Boundaries[idx].lower <= codePoint
e non
Boundaries[idx].lower >= codePoint
 ;)

Stilgar

  • Global Moderator
  • Hero Member
  • *****
  • Post: 1676
  • Karma: +2/-0
Re:[Risolto] UInt64
« Risposta #3 il: Dicembre 10, 2017, 09:36:32 am »
Infatti.
Se guradi la correzione ho pure sbagliato a riscriverla.
Ho messo due "upper".
😓
Al mondo ci sono 10 tipi di persone ... chi capisce il binario e chi no.

Stilgar

  • Global Moderator
  • Hero Member
  • *****
  • Post: 1676
  • Karma: +2/-0
Re:[Risolto] UInt64
« Risposta #4 il: Dicembre 11, 2017, 02:02:11 am »
cmd (questa volta faccio copie e incolla)
Codice: [Seleziona]
for idx := low(Boundaries) to High(Boundaries) do
  begin
    if (codePoint > Boundaries[idx].lower) and (Boundaries[idx].upper < codePoint) then
      continue
    else
    begin
      mask := Boundaries[idx].mask;
      len  := Boundaries[idx].len;
      break;
    end;
  end; 
Questa funziona a prescidere dalle ottimizzazioni del compilatore ;)
Al mondo ci sono 10 tipi di persone ... chi capisce il binario e chi no.

SB

  • Scrittore
  • Full Member
  • *****
  • Post: 106
  • Karma: +0/-0
Re:[Risolto] UInt64
« Risposta #5 il: Dicembre 11, 2017, 06:55:35 am »
Sicuro???  ;)

Stilgar

  • Global Moderator
  • Hero Member
  • *****
  • Post: 1676
  • Karma: +2/-0
Re:[Risolto] UInt64
« Risposta #6 il: Dicembre 11, 2017, 07:23:20 am »
😉 vedo uscire i caratteri che mi aspetto
Al mondo ci sono 10 tipi di persone ... chi capisce il binario e chi no.

SB

  • Scrittore
  • Full Member
  • *****
  • Post: 106
  • Karma: +0/-0
Re:[Risolto] UInt64
« Risposta #7 il: Dicembre 14, 2017, 11:17:30 am »
starò diventando vecchio, ma mi sembra che questa condizione:
if (codePoint > Boundaries[idx].lower) and (Boundaries[idx].upper < codePoint) then
dovrebbe essere scritta così
if (codePoint < Boundaries[idx].lower) or (Boundaries[idx].upper < codePoint) then
Così come è scritta attivi la mask che precede quella che vuoi

Stilgar

  • Global Moderator
  • Hero Member
  • *****
  • Post: 1676
  • Karma: +2/-0
Re:[Risolto] UInt64
« Risposta #8 il: Dicembre 14, 2017, 11:58:44 am »
oddio.
Siccome non posso scrivere il test nella sintassi [Lower..upper] devo scrivermelo io, in altra forma, partiamo da questo assunto.

Così devo testare se il valore è maggiore o uguale alla soglia inferiore, ma non deve superare quella superiore.
Secondo xiny c'è un baco nel compilarore con gli uint64.  Quindi con il test ">= lower and <=" upper mi fa impazzire e sceglie i parametri di trasformazione sucessivi a quello che mi serve. Quindi al sposto di 2 caratteri me lo trasfroma a 3 al posto di 3 a 4.

Quindi salvo svarioni notturni sul codice sono arrivato ad avere qualcosa di stabile con:
Codice: [Seleziona]
function UnicodeCodePointToUTF8(codePoint: UInt64): string;
type
  TBoundary = record
    lower: UInt64;
    upper: UInt64;
    mask: byte;
    len: byte;
  end;

  {
    0000 0000-0000 007F   0xxxxxxx
    0000 0080-0000 07FF   110xxxxx 10xxxxxx
    0000 0800-0000 FFFF   1110xxxx 10xxxxxx 10xxxxxx
    0001 0000-001F FFFF   11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
    0020 0000-03FF FFFF   111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
    0400 0000-7FFF FFFF   1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
 }

const
  Boundaries: array[0..5] of
    TBoundary = (
    (lower: $00000000; upper: $0000007F; mask: $00; len: 1),
    (lower: $00000080; upper: $000007FF; mask: $C0; len: 2),
    (lower: $00000800; upper: $0000FFFF; mask: $E0; len: 3),
    (lower: $00010000; upper: $001FFFFF; mask: $F0; len: 4),
    (lower: $00200000; upper: $03FFFFFF; mask: $F8; len: 5),
    (lower: $04000000; upper: $7FFFFFFF; mask: $FC; len: 6)
    );
var
  ret: array of byte;
  len, mask: word;
  idx: integer;
  sixBits: byte;
begin
  len := Boundaries[0].len;
  for idx := low(Boundaries) to High(Boundaries) do
  begin
    if (codePoint > Boundaries[idx].lower) and (Boundaries[idx].upper < codePoint) then
      continue
    else
    begin
      mask := Boundaries[idx].mask;
      len  := Boundaries[idx].len;
      break;
    end;
  end;
  SetLength(ret, len);
  for idx := len - 1 downto 1 do
  begin
    sixBits   := codePoint and $3F;
    codePoint := codePoint shr 6;
    ret[idx]  := $80 or sixBits;
  end;

  ret[0] := mask or (codePoint and $FF);

  SetLength(Result, Length(ret));
  Move(ret[0], Result[1], length(ret));
end;
   


Lo scopo è capire come caricare i font "personalizzati" dalle risorse dell'applicazione ;)
Quindi nulla di trascendentale :)
EDIT:
In allegato il modulo che la usa.

 
« Ultima modifica: Dicembre 14, 2017, 12:01:01 pm da Stilgar »
Al mondo ci sono 10 tipi di persone ... chi capisce il binario e chi no.

 

Recenti

How To

Trascinare un file nel programma da xinyiman
DB concetti fondamentali e ZeosLib da xinyiman
Recuperare codice HTML da pagina web da xinyiman
Mandare mail con Lazarus da xinyiman
Stabilire il sistema operativo da xinyiman
Esempio lista in pascal da xinyiman
File INI da xinyiman
Codice di attivazione da xinyiman
Realizzare programmi multilingua da xinyiman
Lavorare con le directory da xinyiman
Utilizzare Unità esterne da Loryea
TTreeView da xinyiman
TTreeview e Menu da xinyiman
Generare controlli RUN-TIME da xinyiman
LazReport, PDF ed immagini da xinyiman
Intercettare tasti premuti da xinyiman
Ampliare Lazarus da xinyiman
Lazarus e la crittografia da xinyiman
System Tray con Lazarus da xinyiman
UIB: Unified Interbase da Microges2000
Il file: questo sconosciuto da Microges2000
Conferma di chiusura di un applicazione da xinyiman
Liste e puntatori da Microges2000
Overload di funzioni da Microges2000
Funzioni a parametri variabili da Microges2000
Proprietà da Microges2000
Conversione numerica da Microges2000
TImage su Form e Panel da Maverich
Indy gestiore server FTP lato Client da Maverich
PopUpMenu sotto Pulsante (TSpeedButton) da Maverich
Direttiva $macro da Microges2000
Toolbar da xinyiman
Evidenziare voci TreeView da Maverich
Visualizzare un file Html esterno da Maverich
StatusBar - aggirare l'errore variabile duplicata da Maverich
Da DataSource a Excel da xinyiman
Le permutazioni da xinyiman
Brute force da xinyiman
Indy 10 - Invio email con allegati da Maverich
La gestione degli errori in Lazarus da xinyiman
Pascal Script da xinyiman
Linux + Zeos + Firebird da xinyiman
Dataset virtuale da xinyiman
Overload di operatori da Microges2000
Lavorare con file in formato JSON con Lazarus da nomorelogic
Zeos ... dietro le quinte (prima parte) da Stilgar
Disporre le finestre in un blocco unico (come Delphi) da Maverich
Aspetto retrò (Cmd Line) da xinyiman
Come interfacciare periferica twain da Narciso
Ubuntu - aggiornare free pascal e lazarus da xinyiman
fpcup: installazioni parallele di lazarus e fpc da nomorelogic
Free Pascal e Lazarus sul Raspberry Pi da nomorelogic
Cifratura: breve guida all'uso dell'algoritmo BlowFish con lazarus e free pascal. da nomorelogic
Creare un server multithread da xinyiman
guida all'installazione di fpc trunk da subversion in linux gentoo da nomorelogic
Indice da nomorelogic
DB concetti fondamentali e connessioni standard da xinyiman
Advanced Record Syntax da nomorelogic
DB concetti fondamentali e DBGrid da xinyiman
DB concetti fondamentali e TDBEdit, TDBMemo e TDBText da xinyiman
Advanced Record Syntax: un esempio pratico da nomorelogic
Superclasse form base per programmi gestionali (e non) da nomorelogic
Superclasse form base per programmi gestionali (e non) #2 - log, exception call stack, application toolbox da nomorelogic
Superclasse form base per programmi gestionali (e non) #3 - traduzione delle form da nomorelogic
Superclasse form base per programmi gestionali (e non) #4 - wait animation da nomorelogic
Un dialog per la connessione al database:TfmSimpleDbConnectionDialog da nomorelogic
Installare lazarus su mac osx sierra da xinyiman
Utenti
  • Utenti in totale: 549
  • Latest: suh
Stats
  • Post in totale: 11010
  • Topic in totale: 1366
  • Online Today: 14
  • Online Ever: 74
  • (Luglio 09, 2012, 11:05:53 am)
Utenti Online
Users: 0
Guests: 18
Total: 18

Disclaimer:

Questo blog non rappresenta una testata giornalistica poiché viene aggiornato senza alcuna periodicità. Non può pertanto considerarsi un prodotto editoriale ai sensi della legge n. 62/2001.