]> git.za3k.com Git - za3k.git/commitdiff
Make page clearer, correct command
authorZachary Vance <za3k@za3k.com>
Fri, 20 Nov 2015 06:21:09 +0000 (22:21 -0800)
committerZachary Vance <za3k@za3k.com>
Fri, 20 Nov 2015 06:21:09 +0000 (22:21 -0800)
github.html

index 67d7f9421ac61a4cf9056fd7cd9ad0578a175428..e34525542cd6386663946a8af3c585568111685e 100644 (file)
@@ -1,22 +1,25 @@
 <html>
 <head><title>Github Archive</title></head>
 <body>
-Currently no one has archived github.com.
+Currently no one has archived github.com. This webpage is about progress toward that.
 
-I host the metadata for the repositories. Metadata for gists is currently unavailable from github, but I'm working with them to make it public.
+I host the metadata for the repositories:
 <ul>
        <li>Full repository metadata is available in batches of 10,000 at <pre>http://za3k.com/github/repos-&lt;X>0000-&lt;X+1>0000.json
 http://za3k.com/github/repos-&lt;X>0000-&lt;X+1>0000.json.gz</pre>
     To download all files, run <pre>
 
 for x in {0..100}; do \
-  wget "http://za3k.com/github/repos-$((x*10000))-$(((x+1)*10000)).json.gz"\
+  wget "http://za3k.com/github/repos-$((x*10000))-$(((x+1)*10000)).json.gz"\
 done
     </pre>
+    The files are around 10G compressed, 100G uncompressed.
 </li>
        <li>You can grab greatly abbreviated metadata (recommended) as <a href="https://za3k.com/github/repos.json">JSON</a>.</li>
        <li>Finally, you can get a txt file of just the repo names: <a href="https://za3k.com/github/repos.txt">txt</a>.</li>
-</ul>
+</ul> 
+
+Metadata for gists is currently unavailable from github, but I'm working with them to make it public.
 
 Additional information:
 <ul>