Recensione di Octoparse: Estrazione Dati Facile

L’estrazione dati web o estrazione automatica di dati, può essere uno strumento incredibilmente prezioso per individui e aziende. Anche se l’estrazione dati web può essere effettuata manualmente, può rapidamente trasformarsi in un compito estremamente noioso. Per accelerare il processo, si consiglia agli utenti di utilizzare uno strumento di estrazione dati web invece, come quello offerto da Octoparse. L’azienda ha recentemente lanciato una nuova versione (8.4) del suo software, che porta con sé una serie di miglioramenti. In questo articolo, diamo un’occhiata più da vicino a cosa offre Octoparse 8.4.
Nota: questo è un articolo sponsorizzato ed è stato reso possibile da Octoparse. I contenuti e le opinioni reali sono le sole vedute dell’autore che mantiene l’indipendenza editoriale anche quando un post è sponsorizzato.
Conoscere Octoparse 8.4
Octoparse è uno strumento di estrazione dati web semplice da usare e ricco di funzionalità. È dotato di una serie di modelli convenienti che consentono agli utenti di iniziare immediatamente l’estrazione dati web senza troppi sforzi. Poiché Octoparse non richiede alcuna conoscenza di programmazione, chiunque può procedere e utilizzare il software di data mining.
Tuttavia, c’è una curva di apprendimento costante da tenere in considerazione se si desidera utilizzare questo programma al massimo delle sue capacità. Fortunatamente, Octoparse mette a disposizione una vasta biblioteca di tutorial in modo da poter imparare a eseguire vari compiti in breve tempo.

Octoparse 8.4 è disponibile per utenti Windows (7, 8, 10) o macOS (10.10 e superiori) sul sito ufficiale. Se si utilizza un sistema Windows XP o x32, sarà necessario scaricare la versione precedente Octoparse 7.3.0.
Cosa Puoi Fare con Octoparse 8.4?
Con Octoparse, puoi estrarre ogni tipo di dati, inclusi i dati sui prodotti da grandi siti di e-commerce come Amazon, eBay, Target, Walmart e altri. Inoltre, lo strumento può puntare ai principali siti di social media, come Facebook, Twitter, Instagram, YouTube, ecc., per ottenere post, commenti, immagini e altro ancora.
Troverai una serie di modelli che puntano a questi siti molto specifici non appena apri Octoparse 8.4. Ad esempio, il modello di Facebook è progettato per estrarre commenti per ciascun post da una pagina di un account Facebook. Per provarlo, tutto ciò che devi fare è premere il pulsante blu “Provaci”.
Inoltre, Octoparse può aiutarti a monitorare prezzi, valutazioni e recensioni di hotel su siti come Booking o TripAdvisor o creare un database specifico estraendo informazioni da siti come Pagine Gialle, Yelp, Crunchbase e altri.
Completato il processo di estrazione dei dati web, gli utenti di Octoparse possono esportare i risultati in vari formati, tra cui Excel, HTML, TXT, CVS o database come MySQL, SQL Server e Oracle.
Lavorare con la Modalità Avanzata
A parte i modelli, Octoparse ti consente di estrarre dati da qualsiasi sito web. È piuttosto semplice impostare un’operazione. C’è un nuovo layout nella nuova versione che sposta il flusso di lavoro da sinistra a destra. C’è anche un’area di impostazione avanzata situata nell’angolo, rendendo più facile per gli utenti definire le azioni desiderate.
In generale, l’interfaccia è più spaziosa e dà l’impressione di avere molto spazio per muoversi. Anche così, consigliamo di utilizzare un monitor più grande quando si lavora in Octoparse. Nonostante l’aggiornamento, l’esperienza risulta ancora un po’ angusta su un laptop standard.
In modalità avanzata, dovrai incollare un URL pertinente nell’applicazione.

Successivamente, il programma caricherà automaticamente la pagina ed estrarrà ciò che considera informazioni rilevanti. I risultati appariranno nella parte inferiore dello schermo. Puoi rimuovere i campi di cui non sei interessato, semplicemente cliccando sui tre puntini, quindi selezionando l’opzione “Elimina”.

L’ultima versione sfrutta la tecnica Webview all’interno del browser, che offre ottime capacità antifreeze. I nostri test non hanno riscontrato problemi di congelamento della pagina fastidiosi.
Tieni D’occhio i Suggerimenti
Seguendo le istruzioni sopra, Octoparse estrarrà dati solo dalla pagina attuale, ma se desideri che il programma estragga dati da tutte le pagine, dovrai creare un ciclo di paginazione. Il primo passo per farlo è creare un flusso di lavoro. Clicca il pulsante per iniziare.

La casella di suggerimenti ora mostrerà una serie di opzioni. Seleziona “Clicca sul pulsante Carica Altro”, quindi scorri verso il basso fino in fondo alla pagina fino a trovare il pulsante “Pagina successiva” o qualcosa di simile. Cliccaci sopra e premi il pulsante “Conferma”.

Se hai bisogno di più dati di quanti ne abbia originariamente raccolti Octoparse, puoi creare un secondo elemento che selezionerà ogni elemento nell’elenco e prenderà i dati che desideri.
Per iniziare, vai su un elemento nell’elenco e cliccalo, quindi seleziona l’opzione “Clicca URL” dal menu Suggerimenti.

La pagina dedicata all’elemento si caricherà ora. Clicca sui campi rilevanti e questi appariranno qui sotto. Puoi modificarli se lo desideri.

Esegui il Compito
Quando sei finalmente soddisfatto della bozza del compito che hai creato, è il momento di eseguirlo sul tuo dispositivo o programmarlo (Locale). È anche possibile eseguirlo nel Cloud, ma questa opzione è disponibile solo per coloro che hanno un piano.

Il processo di estrazione di tutto non richiede troppo tempo, e quando è completato, puoi immediatamente cliccare il pulsante “Esporta Dati” e scegliere il tuo formato preferito da lì.

Octoparse è abbastanza complesso e puoi ottenere di più con esso oltre a impostare semplici compiti. Ad esempio: raffinare i dati che hai estratto. Con lo Strumento RegEx nella Cassetta degli Attrezzi, puoi pulire i dati, come sostituire il testo.

Ciao, Zapier!
Dobbiamo anche notare che con la versione 8.4, Octoparse ha unito le forze con Zapier, e questa integrazione significa che gli utenti possono ora utilizzare il servizio di estrazione dati web in combinazione con migliaia di app, come Google Drive, Google Sheets, Slack e altre.
Per iniziare a integrare flussi di lavoro, dovrai accedere a Zapier sul tuo dispositivo. Quindi fai clic sul pulsante “Crea Zap” sul lato destro dello schermo. Volevamo configurare uno Zap che potesse sostituire i file di Google Drive con nuovi documenti elaborati in Octoparse.
Per impostare un trigger, dovrai usare la barra di ricerca per trovare e selezionare Octoparse. Collegati con il tuo account Octoparse e inizia a impostare il trigger. Scegli il compito Octoparse target, che puoi cercare per ID, quindi imposta il tuo stato ideale del compito. Trovare l’ID del compito è un po’ complicato quando lo fai per la prima volta. Fortunatamente, la documentazione ti copre, quindi puoi capirlo rapidamente. (Suggerimento: devi eseguire il compito nel cloud.)

In seguito, dovrai selezionare l’app di azione, che in questo esempio è Google Docs.

In questa sezione dovrai definire diversi parametri. Quello più importante è l’evento di azione, quindi assicurati di scegliere un’opzione adeguata. Dopo di che, dovrai specificare ulteriori dettagli riguardo all’azione nei campi “Imposta azione”.

Il processo si è dimostrato abbastanza fluido la volta successiva quando abbiamo provato a creare un nuovo Zap. Ci vuole solo un po’ di abitudine. Potrebbe anche richiederti di fare un po’ di lettura. Fortunatamente, sia Zapier che Octoparse offrono la propria biblioteca di tutorial, quindi non sarai costretto a investire molto tempo nella ricerca.
Ottieni Octoparse Ora
Puoi provare Octoparse gratuitamente, il che è perfetto per coloro che cercano di intraprendere alcuni progetti semplici. Registrati con un account per iniziare. Tuttavia, per accedere a tutte le funzionalità complete dovrai passare a uno dei tre piani a pagamento:
- Piano Standard: $75/mese
- Piano Professionale: $209/mese
- Piano Enterprise: funzionalità personalizzate disponibili su richiesta

Sebbene ci siano molte cose che puoi fare nella versione gratuita, le versioni a pagamento offrono opzioni avanzate. Questo include l’accesso a un numero maggiore di crawlers, estrazioni programmate, estrazioni cloud simultanee, rotazione automatica degli IP, accesso API, supporto via email e altro ancora.
Se sei curioso riguardo a Octoparse, puoi iniziare dal piano gratuito per vedere quanto bene soddisfa le tue esigenze. L’ultima versione è disponibile per il download sul sito ufficiale proprio ora.