Membaca Web Melalui URL dengan Java

Sebelumnya kita telah belajar bagaimana melakukan parsing URL dengan Java.

Pembahasan parsing URL dapat anda baca di post sebelumnya.

Selanjutnya pada post berikut ini kita akan membaca web melalui URL dengan Java.

URL yang akan dibaca misalnya adalah Google.com

Hasil dari program berupa tag html atau Javascript dari website yang di baca URL nya.

Membaca Web Melalui URL dengan Java

Program berikut ini menggunakan openStream() untuk mendapatkan input stream dari http://google.com yang selanjutnya membuka BufferedReader untuk selanjutnya dibaca di dalamnya.

Semua yang dibaca di dalam BufferedReader akan dicopy ke standard output stream.

Ketika program dijalankan, anda akan melihat output berupa isi dari file html seperti tag dan script.

Berikut adalah source code nya:

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.MalformedURLException;
import java.net.URL;

public class readUrl {
    public static void main(String[] args) throws MalformedURLException, IOException {
        URL url = new URL("http://google.com");
        BufferedReader br = new BufferedReader(new InputStreamReader(url.openStream()));

        String inputLine;
        while ((inputLine = br.readLine()) != null) {            
            System.out.println(inputLine);
        }
        br.close();
    }
}

Output program:

<!doctype html><html itemscope=”itemscope” itemtype=”http://schema.org/WebPage”><head><meta content=

…..dst…..

google.timers.load.t.prt=e=(new Date).getTime();})();</script></body></html>

Jika outputĀ  tersebut disimpan ke dalam file html, maka dapat menampilkan bentuk dari website seperti gambar berikut ini:

membaca web melalui url dengan java
Java ReadURL

Referensi: Oracle Documentation

Semoga bermanfaat.

Leave a Comment