1

by Matthew Trentacoste

不動産情報サイト・SUUMOの物件のURLをコピー&ペーストするだけで、家賃・管理費・敷金・礼金・仲介手数料・鍵交換等・更新料・2年間合計・初期費用・築年数・面積・家賃/平方メートルなどの物件の比較表が簡単に作れてしまうスプレッドシートがエンジニアのtofuさんによって公開されています。

家探しのための Suumo スクレイピング用スプレッドシート - Fascinated with Tofu

http://tofu.hatenadiary.com/entry/2017/02/19/suumo-scraping



「家探しのための Suumo スクレイピング用スプレッドシート」はウェブスクレイピングを使ったGoogleスプレッドシート。どういうものなのか?ということは実際に使ってみるのがわかりやすいので、まずは上記のウェブページに記載されているURLをクリックします。



すると以下のようなページに移動。URL・タイトル・メモ・家賃・管理費・敷金・礼金・仲介手数料・鍵交換等・更新料・2年間合計・初期費用・築年数・面積・家賃/平方メートルの項目が並んでおり、スプレッドシートの4行目が編集可能です。



ということで、SUUMOで自分の条件にある物件を探します。



「いいな」と思うところがあったら……



4行目の1列目に物件のページのURLをコピー&ペースト。



すると、各種情報がシートに反映され、直上の物件との違いが一目瞭然に。



実際にURLの元ページを確認してみたところ、管理費・共益費・家賃・敷金・礼金などがちゃんと反映されていました。



作者のTOFU2000さんによると、スプレッドシートの各項目の計算式は以下のようになっているとのこと。

家賃

=REGEXREPLACE(IMPORTXML(A3,"//*[@id='contents']/div[1]/div[2]/div[1]/table/tbody/tr/td[1]/div/div[1]/span"), "万円", "")

管理費

=REGEXREPLACE(REGEXREPLACE(IMPORTXML(A3, "//*[@id='contents']/div[1]/div[2]/div[1]/table/tbody/tr/td[1]/div/div[2]/span"), "管理費・共益費 ", ""), "円", "")/10000

敷金

=REGEXREPLACE(IMPORTXML(A3,"//*[@id='contents']/div[1]/div[2]/div[1]/table/tbody/tr/td[2]/div/div[1]/span[2]"), "万円", "")

礼金

=REGEXREPLACE(IMPORTXML(A3,"//*[@id='contents']/div[1]/div[2]/div[1]/table/tbody/tr/td[2]/div/div[2]/span[2]"), "万円", "")

築年数

=IMPORTXML(A3, "//*[@id='contents']/div[1]/div[2]/div[1]/table/tbody/tr/td[4]/div/div[2]")

面積

=REGEXREPLACE(IMPORTXML(A3, "//*[@id='contents']/div[1]/div[2]/div[1]/table/tbody/tr/td[3]/div/div[2]/text()"), "m", "")

仲介手数料

=家賃/2+1.5

どこかのサイトで読んだざっくり式

更新料

1ヶ月分の家賃想定

鍵交換等

すみませんスクレイピングできなかったので、目 grep してください。

保険, クリーニング代 etc…

トータルコスト(2年)

=(家賃+管理費)*24+敷金+礼金+仲介手数料(+鍵交換等)

初期費用

=(家賃+管理費)*2+敷金+礼金+仲介手数料(+鍵交換等)

トータルコストも気になりますが、初期費用がどれくらいなのかも知りたいですよね。 だいたい家賃の 4.5 ヶ月分程度になると言われています。(ソース不明)


この計算式を応用して独自のスプレッドシートを作ったり、サンプルのスプレッドシートをコピー&ペーストなどすれば、住みたい家を決めるときの比較表がサクッと作れるわけです。



なお、URLを貼っていくと、ときどき「#VALUE!」となってしまうところがあります。これは物件によって管理費などの記載がなく、管理費を使ってトータルコストや初期費用の計算ができないためでした。



なお、物件の掲載期間が終わるとスクレイピングしていた情報ごと消えてしまうので、「あとで見返したりしたい場合は、値のみコピー/バックアップする運用をおすすめします」とのことです。