]> git.za3k.com Git - za3k.git/commitdiff
Mention news server
authorZachary Vance <za3k@za3k.com>
Mon, 30 Nov 2015 04:51:48 +0000 (20:51 -0800)
committerZachary Vance <za3k@za3k.com>
Mon, 30 Nov 2015 04:51:48 +0000 (20:51 -0800)
github.html
index.html

index 8e00d4e8d636bb59be459ca3a8742449eb40c84a..7b333a867bd7596cf33d7ae0d580e81c12e80096 100644 (file)
@@ -4,20 +4,20 @@
 <p>Currently no one has backed up github.com (aside from Github). This webpage is about progress toward that. If you have 150-200TB of disk space and really good internet, please <a href="https://za3k.com">contact me</a> about getting a copy of github.</p>
 
 <h3>List of Respositories</h3>
-I host some metadata about github's repositories. This includes a lot of basic data about the repository, but NOT the issues, any wiki, downloads, or the git repository. As of Nov 2015, github has 28 million repositories.
+I host some metadata about github's repositories. This includes a lot of basic data about the repository, but NOT the issues, any wiki, downloads, or the git repository. As of Nov 2015, github has 28.3 million repositories.
 <ul>
-       <li><p>Full repository metadata is available in JSON format. The format is explained on the <a href="https://developer.github.com/v3/repos/#list-all-public-repositories">github API</a>.</p>
+       <li>You can grab greatly abbreviated metadata (recommended) as <a href="https://za3k.com/github/repos.json.gz">JSON</a>. This includes the repository name and URL, whether it is a fork (and what of), and a short description.</li>
+       <li>You can get a txt file of just the repo names: <a href="https://za3k.com/github/repos.txt.gz">txt</a> (676M uncompressed, 332M compressed).</li>
+       <li><p>Finally, full repository metadata is available in JSON format. The format is explained on the <a href="https://developer.github.com/v3/repos/#list-all-public-repositories">github API</a>.</p>
     <p>The files are available in batches of 10,000 at <pre>http://za3k.com/github/repos-&lt;X>0000-&lt;X>9999.json
 http://za3k.com/github/repos-&lt;X>0000-&lt;X>9999.json.gz</pre>
     To download all files, run <pre>
-    for x in {0..4700}; do \
+    for x in {0..5000}; do \
       echo "https://za3k.com/github/repos-${x}0000-${x}9999.json.gz"; \
     done | wget -N -i -
     </pre>
-    The combined size of these files is <b>15G compressed</b>, 168G uncompressed. Files are grouped by github's internal id; since some repositories are deleted or privated, each file contains less than 10,000 repositories.
+    The combined size of these files is <b>9.7G compressed</b>, 115G uncompressed. Files are grouped by github's internal id; since some repositories are deleted or privated, each file contains less than 10,000 repositories.
 </li>
-       <li>You can grab greatly abbreviated metadata (recommended) as <a href="https://za3k.com/github/repos.json">JSON</a>. This includes the repository name and URL, a short description, whether it is a fork (and what of), and the approximate size of the repository.</li>
-       <li>Finally, you can get a txt file of just the repo names: <a href="https://za3k.com/github/repos.txt">txt</a>.</li>
        <li>This data was downloaded using a <a href="https://github.com/za3k/github-backup">custom tool</a> I wrote. My tool gets the data from the github API v3, with as little modification as possible.</li>
 </ul> 
 
index 0902253d0033bb370e866307ed47703587defd2c..c389c171cea72d4b3d1e35e8d173893d963825ce 100644 (file)
@@ -92,6 +92,7 @@
             <li>Get some <a href="http://moreorcs.com">orc-themed email addresses</a> <a href="https://github.com/za3k/moreorcs">[Source]</a></li>
             <li><a href="https://publishing.za3k.com">Publish</a> any physical book at minimum cost and maximum convenience</li>
             <li><a href="https://irc.za3k.com/?channels=forum">Web chat</a> for irc.za3k.com</li>
+            <li>An independent news server, located at nttp.za3k.com:563. You'll need a client that supports TLS access. Thunderbird works well.</li>
         </ul>
     </section>