Hallo,
hat einer eine Idee, wie ich HTML-Dateien auslesen und den Text (mit Formatierung, so weit das übertragbar ist) in einer RTF-Datei abspeichern kann? Gibt es Komponenten in Lazarus, die sowas schon machen?
Herzlichen Dank.
HTML auslesen und in RTF speichern
- af0815
- Lazarusforum e. V.
- Beiträge: 6837
- Registriert: So 7. Jan 2007, 10:20
- OS, Lazarus, FPC: FPC fixes Lazarus fixes per fpcupdeluxe (win,linux,raspi)
- CPU-Target: 32Bit (64Bit)
- Wohnort: Burgenland
- Kontaktdaten:
Re: HTML auslesen und in RTF speichern
Such mal in der Lazarus ccr, dort hat IMHO Christian schon was geschrieben. Ist zwar nicht 100pro was du willst, zeigt aber die Technik.
Man parst die Seite und setzt die Formatierung in die Zielplattform um. Jetzt kommt es darauf an, wie komplex das ganze arbeiten soll
Man parst die Seite und setzt die Formatierung in die Zielplattform um. Jetzt kommt es darauf an, wie komplex das ganze arbeiten soll

Blöd kann man ruhig sein, nur zu Helfen muss man sich wissen (oder nachsehen in LazInfos/LazSnippets).
-
- Beiträge: 244
- Registriert: Do 21. Jan 2010, 22:33
- OS, Lazarus, FPC: Windows Vista (L 0.9.31 FPC 2.5.1)
- CPU-Target: 32Bit
- Wohnort: z.z. Brasilien, sonst 82335 Berg-Leoni (südlich von München)
Re: HTML auslesen und in RTF speichern
Was bedeutet das genau: IMHO Christian?af0815 hat geschrieben:Such mal in der Lazarus ccr, dort hat IMHO Christian schon was geschrieben. Ist zwar nicht 100pro was du willst, zeigt aber die Technik.
Beim Googlen nach Lazarus ccr bin ich auf folgende Seite gelangt: Using the Lazarus-ccr SVN repository (http://wiki.freepascal.org/Using_the_La ... repository" onclick="window.open(this.href);return false;)
Da gibt es ein paar Mal einen Christian, aber nichts mit HTML oder RTF. Wo soll ich also suchen (und nach was speziell)?
- af0815
- Lazarusforum e. V.
- Beiträge: 6837
- Registriert: So 7. Jan 2007, 10:20
- OS, Lazarus, FPC: FPC fixes Lazarus fixes per fpcupdeluxe (win,linux,raspi)
- CPU-Target: 32Bit (64Bit)
- Wohnort: Burgenland
- Kontaktdaten:
Re: HTML auslesen und in RTF speichern
Lazarus ccr -> Applications -> wikihelp
http://lazarus-ccr.svn.sourceforge.net/ ... /wikihelp/
Das habe ich gemeint, Sorry aber ich sitze derzeit auf Rehab mit nur einem iPad und fast ohne Internet fest
Die Applikation zeigt meines Erachtens wie man von einem Format im Internet in ein anderes Format umsetzen kann.
http://lazarus-ccr.svn.sourceforge.net/ ... /wikihelp/
Das habe ich gemeint, Sorry aber ich sitze derzeit auf Rehab mit nur einem iPad und fast ohne Internet fest

Die Applikation zeigt meines Erachtens wie man von einem Format im Internet in ein anderes Format umsetzen kann.
Blöd kann man ruhig sein, nur zu Helfen muss man sich wissen (oder nachsehen in LazInfos/LazSnippets).
-
- Beiträge: 323
- Registriert: Di 12. Apr 2011, 13:21
- OS, Lazarus, FPC: WinXP + VMWare Player mit Fedora14, L 1.1, FPC 2.7.1
- CPU-Target: 1core 1,8GHz 32Bit
- Wohnort: Fürth
- Kontaktdaten:
Re: HTML auslesen und in RTF speichern
nach http://dict.leo.org/ : IMHO = "in my humble opinion" = "meiner unbedeutenden Meinung nach"br_klaus hat geschrieben:Was bedeutet das genau: IMHO Christian?
-
- Beiträge: 244
- Registriert: Do 21. Jan 2010, 22:33
- OS, Lazarus, FPC: Windows Vista (L 0.9.31 FPC 2.5.1)
- CPU-Target: 32Bit
- Wohnort: z.z. Brasilien, sonst 82335 Berg-Leoni (südlich von München)
Re: HTML auslesen und in RTF speichern
Herzlichen Dank. Sieht vielversprechend aus. Werde es mir mal zu Gemüte führen.af0815 hat geschrieben:Lazarus ccr -> Applications -> wikihelp
http://lazarus-ccr.svn.sourceforge.net/ ... /wikihelp/
Das habe ich gemeint, Sorry aber ich sitze derzeit auf Rehab mit nur einem iPad und fast ohne Internet fest
Die Applikation zeigt meines Erachtens wie man von einem Format im Internet in ein anderes Format umsetzen kann.
Ich hätte da noch eine andere Frage: wie werden in HTML fremdsprachige Zeichen (zB chinesisch, japanisch, russisch o.ä.) ausgegeben? Ich sehe da im HTML-Text auch nur ein Wirrwar von ASCII-Zeichen zwischen 32 und 254. Ist das Unicode? Und wo kann man eine Überstzungstabelle für solche Zeichen finden?
Die möchte ich nämlich auch in RTF abspeichern...
Re: HTML auslesen und in RTF speichern
Heute eigentlich in UTF-8. Was du meinst, ist wahrscheinlich das da:br_klaus hat geschrieben: Ich hätte da noch eine andere Frage: wie werden in HTML fremdsprachige Zeichen (zB chinesisch, japanisch, russisch o.ä.) ausgegeben? Ich sehe da im HTML-Text auch nur ein Wirrwar von ASCII-Zeichen zwischen 32 und 254. Ist das Unicode? Und wo kann man eine Überstzungstabelle für solche Zeichen finden?
Die möchte ich nämlich auch in RTF abspeichern...
http://www.w3schools.com/tags/ref_entities.asp" onclick="window.open(this.href);return false;