Nokogiri

Nokogiri で encoding error

以下のファイルを Nokogiri で解析させるとエラー。 demo-1.html <html lang="ja" xmlns="http://www.w3.org/1999/xhtml" xml:lang="ja"> <head> </head></html>

Nokogiri の encoding をどのような文字列で指定すれば良いか?

Nokogiri で Nokogiri::HTML.parse(open(url)[, url[, encoding]]) 等と 文字コードを指定したい場合 文字列で指定するわけだが、 どのような文字列を使えば良いのか?ソースを読むと、Nokogiri::HTML::Document.read_memory で LibXMLを 呼び出している。そ…

Nokogiri のインストール

普段 サイトの解析をする際、 Hpricot や REXML を使っている。 しかし、REXML で XPath の処理を行うと非常に重い。(ロケーションパスを "//word" 等と指定した場合が非常に重い)Ruby XML Performance Shootout: Nokogiri vs LibXML vs Hpricot vs REXML に…