ChromeのローカルストレージをBashから正規表現検索したかった、というお話についてです。
僕は普段、JavaScript経由でローカルストレージにいろんなデータを入れておいてあります。例えば、Google検索の検索クエリを保存したり。
時刻と検索クエリを保存しています。今までは、こうして保存しておき、必要なときや定期的にコピペでバックアップをして検索、というやり方だったのですが、
ローカルストレージのデータベースを直接横断で正規表現で検索できれば楽だなと思って試してみました。
まず、ローカルストレージファイルはsqlite形式などではなく、LDB (LevelDB) というものが使われています。
これはキーと値だけで構成されるシンプルな構成なのですが、実際には複雑で、キーは文字列に対して、値は複雑なJson形式であったりします。
yuis ASUS /mnt/c/pg$ file '/mnt/c/pg/_chrome/Default/Local Storage/leveldb/400581.ldb'
/mnt/c/pg/_chrome/Default/Local Storage/leveldb/400581.ldb: DOS executable (COM)
LevelDBを扱うには、pythonのplyvelがいいらしいです。
sudo pip2 install plyvel
import plyvel
db = plyvel.DB('/home/yuis/rsync/leveldb')
for key, value in db:
print('"{0}"\t"{1}"'.format(key, value))
python dev.py
Getting data inside a google Chrome IndexedDB from Bash or Python – Stack Overflow
'/home/yuis/rsync/leveldb'
の部分はフォルダです。この形式自体が、一つのフォルダで一つの単位みたいで、個別のldbファイルにするとエラーでます。
rsyncでバックアップとか。
rsync -av /mnt/c/Users/ifgm2/AppData/Local/Google/Chrome/User\ Data/Default/Local\ Storage $TMPDIR/Default/
で、先程の画像の通り、いくらか検索クエリが保存されているはずなので、それを検索すれば出てくるはずなのです。
yuis@yuis:/home/development/tmp$ python dev.py | wc
111827 2318888 162480285
yuis@yuis:/home/development/tmp$ python dev.py | ag "get http status bash" | wc
0 0 0
が、出てこないんですねぇ。
いくらか試してみたけど出てこない。
だからたぶん、文字コードで圧縮されているか、暗号化されているか、hexか、まぁとにかく原型とどめていないので、どこに格納されているかもわからないし、諦めました。
分かる方コメントで教えてください。