Nokogiri
以下のファイルを Nokogiri で解析させるとエラー。 demo-1.html <html lang="ja" xmlns="http://www.w3.org/1999/xhtml" xml:lang="ja"> <head> </head></html>
Nokogiri で Nokogiri::HTML.parse(open(url)[, url[, encoding]]) 等と 文字コードを指定したい場合 文字列で指定するわけだが、 どのような文字列を使えば良いのか?ソースを読むと、Nokogiri::HTML::Document.read_memory で LibXMLを 呼び出している。そ…
普段 サイトの解析をする際、 Hpricot や REXML を使っている。 しかし、REXML で XPath の処理を行うと非常に重い。(ロケーションパスを "//word" 等と指定した場合が非常に重い)Ruby XML Performance Shootout: Nokogiri vs LibXML vs Hpricot vs REXML に…