←フエルチラシノウラ。トップページへもどる。

JavaでHTML文書をパースする

Java プログラミング 開発 HTML パース Parser 解析

HTML文書をパースするサンプルです。
sample.htmlというファイル名のHTML文書を適当に作って
それを同じ階層に置いてから実行してください。

------------メ[ス

import javax.swing.text.*;
import javax.swing.text.html.*;
import javax.swing.text.html.parser.ParserDelegator;
import java.io.*;

public class HtmlParser{

  public static void main(String[] args){
   HtmlParser p = new HtmlParser();
    p.exec();
 }

 public void exec(){   
    Reader reader;
    try {
     reader = new BufferedReader(new FileReader("sample.html"));
     MyParserCallback cb = new MyParserCallback();
      ParserDelegator pd = new ParserDelegator();
     pd.parse(reader, cb, true);
      reader.close();
   } catch (Exception e) {
     e.printStackTrace();
    }
 }

  class MyParserCallback extends HTMLEditorKit.ParserCallback {
   public void handleStartTag(HTML.Tag tag, MutableAttributeSet attr, int pos){
      System.out.println("handleStartTag()が呼ばれました");
      if (tag.equals(HTML.Tag.A)) {
       String ret = (String)attr.getAttribute(HTML.Attribute.HREF);
        System.out.println(ret +"AタグのHREF属性の値ですn");
      }
   }
   public void handleSimpleTag(HTML.Tag tag, MutableAttributeSet attr, int pos){
     System.out.println("handleSimpleTag()が呼ばれました");
     if (tag.equals(HTML.Tag.INPUT)) {
       String ret = (String)attr.getAttribute(HTML.Attribute.VALUE);
       System.out.println(ret +" ←INPUTタグのVALUE属性の値ですn");
     }
   }
 }

}


http://goodjob.boy.jp/chirashinoura/id/54.html

作成日: 2005-12-06 17:30:01

最終更新日: 2005-12-06 17:31:23

▲このページの上へ