Semalt: Fem fantastiske applikationer til skrapning af journalister til journalister

En journalist indsamler, skriver og distribuerer indhold regelmæssigt. Han / hun fokuserer hovedsageligt på generelle spørgsmål, politiske spørgsmål eller naturkatastrofer. De fleste journalister dækker nyheder inden for underholdningsverdenen, mens de andre taler om spil og sport. En journalist skal påtage sig flere tekstskrapningsopgaver på samme tid; han / hun udtrækker ikke kun data, men sikrer også en vis nøjagtighed og legitimitet. Journalister udsætter sig sommetider for fare og skriver nyhedsartikler for at engagere flere og flere læsere. Hvis du vil blive journalist og mangler de grundlæggende programmeringsevner, kan du bruge følgende applikationer til at få dit arbejde gjort.

1. Skraber:

Skraber er en af de bedste og mest nyttige tekst- og billedskrabetjenester. Det er let at bruge og leveres med en brugervenlig grænseflade. Med Scraper kan journalister målrette mod flere websider på samme tid og udtrække data fra hele eller delvise websteder. Skraber er bedst kendt for sin maskinindlæringsteknologi og uddrager almindelig tekst fra CNN, BBC og andre lignende nyhedswebsteder. Du kan derefter eksportere disse data til Google Dokumenter, CSV eller JSON filer. Det bruger XPath til at evaluere kvaliteten af tekster.

2. Overliste hub:

Outwit Hub er velegnet til både journalister og ikke-programmører. Du behøver ikke at lære Python, C ++ eller Ruby for at drage fordel af denne applikation. Det er hovedsageligt en Firefox-udvidelse og skraber tekstfiler, PDF-filer, HTML-dokumenter og billeder til dig. Outwit Hub giver nøjagtige resultater og kan bruges til at indeksere forskellige websteder bekvemt.

3. Scraperwiki:

Du kan bruge Scraperwiki til at udtrække data fra Wikipedia-sider, online tidsskrifter, nyhedswebsteder og e-handelswebsteder. Det er et browserbaseret program, der giver fejlfri resultater med det samme. Hvis du ikke har nogen kodningskendskab, er Scraperwiki den rigtige mulighed for dig. Med denne service kan journalister skrabe hele webstedet og downloade dataene til deres harddiske på få sekunder. Klassisk version af Scraperwiki er velegnet til appudviklere, freelancere og webmastere.

4. Import.io:

Import.io er en af de bedste og mest nyttige tekstskrabetjenester på internettet. Det hjælper journalister med at søge efter aktuelle emner, udtrække data nøjagtigt og offentliggøre dem på deres egne nyhedswebsteder inden for få minutter. Med Import.io kan du skrabe både tekst- og JPG-filer. Når dette værktøj er installeret og aktiveret, påtager det sig op til to tusind tekstskrapningsprojekter ad gangen. Det gør et ret godt stykke arbejde med at hente indhold fra givne URL'er og giver dig mulighed for at analysere data uden noget problem.

5. Kimono Labs:

Ligesom Import.io er Kimono Labs målrettet mod et stort antal sider. Det fungerer som en fuldskala tekstskraber og webcrawler på internettet. Du skal bare nævne den URL, du vil udtrække oplysninger fra, og Kimono Labs vil få de ønskede resultater på få minutter. Det er bedst kendt for sin maskinlæringsteknologi og grave rundt på internettet for at finde passende emner for journalister. Du kan gemme billed- og tekstfilerne i Google Dokumenter eller downloade dem direkte til din computer.

mass gmail