Logo PcPrimiPassi.it
sezioniGuide e Tutorial
Sondaggi
Navighi su internet principalmente tramite:

Personal Computer
56%
Tablet
6%
Smartphone
31%
Un po tutti i dispositivi
6%
newsletter Newsletter

Iscriviti ora !!!

Newsletter di aggiornamento periodico dal nostro portale!

dizionario Dizionario tecnico
Cerca un termine
affiliati Siti affiliati
Articoli, guide e tutorial
software

Come estrarre il testo di un file XML con Notepad++


Può capitare di dover leggere del testo salvato su un file in formato XML, la cui lettura risulta particolarmente ostica a causa dei molti tags speciali adottati da questo standard; vediamo come leggere il testo in formato plain con pochi semplici passaggi utilizzando il software open source Notepad++.


freccia Sezione: Guide softwares
freccia Difficoltà: MINIMA, Compatibilità: Indipendente dal sistema operativo

Condividi e rendi nota questa pagina
Il box di condivisione con i social network non è visibile in quanto non hai accettato i cookies di terze parti su questo sito; qualora volessi utilizzare tale capacità di condivisione è necessario cancellare tutta la cronologia e ricaricare questa pagina, quindi accettare i cookies


Notepad++ XML testo in chiaro

In informatica XML (eXtensible Markup Language) rappresenta un metalinguaggio per la definizione di sezioni di testo sintatticamente definite al fine di poter controllare, usare ed estrarre i significati del testo al loro interno.

Sostanzialmente ottiene questo obiettivo attraverso l'uso di particolari TAGS, ovvero parole chiave specifiche, con significati ben delineati e chiari che devono essere interpretati dal software
che li va ad utilizzare per restituire nel modo corretto cio' che il programmatore (o il creatore) del file voleva ottenere.

Su internet si fa largo uso di files XML che vengono usati per immagazzinare e salvare dati di ogni tipologia tanto che possono svolgere la funzione di piccoli database; più spesso sono utilizzati come files di configurazione dove memorizzare le informazioni e le preferenze di base di un software.

E' anche facile dover utilizzare un file in formato XML per estrapolare alcuni dati per noi importanti; è infatti bene far notare che il formato XML non identifica obbligatoriamente un file in formato .xml ma un modello di organizzare i dati... quindi possiamo avere file con ogni tipo di estensione (tutto cio' che sta dopo il puntino nel nome del file) che pur non ricordando per assonanza il formato xml, di fatto poi
ne seguono il costrutto di base.



La problematica nella lettura di un file XML:


Mi è capitato di recente di dove estrarre i dati all'interno di files creati da app per smartphone di tipo NOTA o MEMO... non potevo reinstallare l'applicazione che li ha generati ma aprendoli con un semplice editor di testo ho capito che erano salvati secondo lo standard XML.

Per capire meglio e più chiaramente come si riconosce un file XML vediamo l'esempio seguente.

File XML su Notepad++

La prima riga identifica che tutto quello che segue è da interpretare secondo lo standard XML.

A seguire troviamo una serie di parole chiave che sviluppano una struttura ad albero per la memorizzazione dei alcuni dati, in questo caso dati di utenti.

Quello che risulta subito chiaro, specialmente a chi non mastica informatica quotidianamente, è come questi dati siano purtroppo immersi all'interno di questi TAGS o parole chiave, tanto da rendere difficilmente leggibili i dati stessi e ancor più difficile estrarli attraverso una banale copia.

Se è già difficile in un piccolissimo files come questo, figuriamoci cosa sarebbe su di un file con un migliaio di parole che magari dobbiamo estrarre.

Abbiamo trovato una semplice soluzione al problema che vogliamo proporvi.




Usare NOTEPAD++ e le regular expression per eliminare i tags xml e lasciare il testo in chiaro:



La soluzione propone l'utilizzo di uno degli editor di testo open source più belli e funzionali di sempre, Notepad++.

Ecco a voi il link per il download: https://notepad-plus-plus.org/

Una volta scaricato vi consiglio di impostare subito l'utilizzo in lingua italiana... per farlo aprite NOTEPAD++ e andiamo sul menu CONFIGURAZIONE, quindi PREFERENZE ed impostiamo la lingua italiana.

Per "ripulire" il nostro file dai tags XML fastidiosi per il nostro scopo, non dovremo fare altro che aprire il nostro file con Notepad++... possiamo farlo semplicemente cliccando con il tasto destro sul file XML e scegliendo la voce "EDIT WITH NOTEPAD++".

Una volta aperto andiamo sul menu CERCA, quindi SOSTITUISCI ed impostiamo la maschera come indicato nello screenshot seguente:

Notepad++ regular expression

Come è possibile vedere si tratta di scivere una serie di caratteri nella casella del testo da trovare ed esattamente la seguente stringa:

<[^>]+>

Essa rappresenta una "ESPRESSIONE REGOLARE" utilizzata dal software per cercare particolari combinazioni di caratteri; tutto questo risulterà nella ricerca dei tags XML che vogliamo estromettere dal nostro file in modo da lasciare solo il testo che ci interessa in chiaro.

Nel box SOSTITUISCI CON impostiamo un testo vuoto... è importante!

Per finire mettiamo la spunta come inficato nella aree contrassegnate in rosso su ESPRESSIONE REGOLARE e SIGNIFICA A CAPO.

A questo punto basterà cliccare su SOSTITUISCI TUTTI per ottenere un testo pulito senza tutti i tags XML .

Notepad++ XML testo in chiaro


Conclusioni:


Questa piccola guida sembra piuttosto specifica ma in realtà va a sanare velocemente e senza spendere un centesimo un bisogno che è più frequente di quanto si creda.

L'installazione di Notepad++ tonerà utile in moltissime attività quotidiane per le sue enormi capacità di adattamento alla elaborazione di testi, quindi scommetto che in molti si affezioneranno ben presto a questo splendido software tanto da adottarlo definitivamente.


RAVEN


Commenti a questa guida

Inserisci il tuo commento
(Non serve la registrazione, solo la tua email per confermare il commento!)


Utente:
Email (questo dato rimane privato):
Commento:


CODICE DI VERIFICA:

Scrivi il risultato della seguente operazione in base al valore dei due dadi:

+


RISULTATO:


Informativa sulla privacy


Ho letto l’informativa Privacy e acconsento al trattamento dei miei dati personali per le finalità ivi indicate.

I dati personali richiesti (indirizzo email, nominativo) saranno utilizzati unicamente per poter visualizzare il tuo commento e rispondere al messaggio in maniera cortese e non saranno diffusi o comunicati a terzi.

L'indirizzo IP di chi commenta viene memorizzato al solo fine di tracciare l'avvenuto consenso espresso. Ricorda di non inviare dati sensibili nel messaggio!!!

ACCONSENTO



Presenti 0 commenti



TI E' PIACIUTO QUESTO CONTENUTO ?
Condividi e rendi nota questa pagina
Il box di condivisione con i social network non è visibile in quanto non hai accettato i cookies di terze parti su questo sito; qualora volessi utilizzare tale capacità di condivisione è necessario cancellare tutta la cronologia e ricaricare questa pagina, quindi accettare i cookies
cerca Cerca nel sito
Cerca in:
In base a:
sostienici Sostienici !
condividi Social Network
Seguici sui social network
Segui PcPrimiPassi sui social Segui PcPrimiPassi su Twitter Segui PcPrimiPassi.it su facebook
download Ultimi Download
faq Domande Top
Tipi di files Tipi di files
team Team & Contatti
sviluppo Sviluppo
Versione 4.3 Developed by Stefano Ravagni