]> gitweb.fperrin.net Git - DictionaryPC.git/blobdiff - data/downloadInputs.sh
Parse foreign text with new wiki parser.
[DictionaryPC.git] / data / downloadInputs.sh
index 9a3492f03059351a19c447ec9374f39ee18e5cc4..89e584a6f52612ef4270a08b31412af93643146f 100755 (executable)
@@ -1,8 +1,14 @@
 #!/bin/bash -e
 
+OLD_DIR=`pwd`
+DIR=`dirname $0`
+
+cd $DIR
+
 echo "Downloading from: http://dumps.wikimedia.org/enwiktionary/"
 WIKI=enwiktionary-20111224-pages-articles.xml
 curl --remote-name http://dumps.wikimedia.org/enwiktionary/20111224/${WIKI}.bz2
+echo "Unzipping... this is slow."
 bunzip2 ${WIKI}.bz2
 mv ${WIKI} inputs/
 
@@ -13,3 +19,5 @@ gunzip ${CHEMNITZ}.gz
 mv ${CHEMNITZ} inputs/
 
 echo "Done.  Now run WiktionarySplitter to spit apart enwiktionary."
+
+cd $OLD_DIR