Procesor: Core 2 Duo E8500 3,16 GHz // OC: 4,10 GHz
RAM: Ocz 2x2GB PC 800MHz DDR2
Dysk: Seagate Barracuda 500 GB
OS: WinSHIT 7 Ultimate x64 && Ubuntu 12.04 LTS
Import pliku
$ mongoimport --type csv -c Train --file Train2.csv --headerline
db.Train.count()
Liczba obiektów: 6034195
Skrypt konwertujący tagi na tablicę:
```js db.train.find( { "tags" : { $type : 2 } } ).snapshot().forEach( function (x) { if (!Array.isArray(x.tags)){ x.tags = x.tags.split(' '); db.train.save(x); }}); ``` Plik zliczający wszystkie słowa: [count](/scripts/lpaczynski/count) Przerobiłem plik do Jsona za pomocą tego [skryptu](/scripts/lpaczynski/toJson.sh) ```bash $ ./toJson.sh text8 ```następnie zimportowałem plik do bazy
```bash $ mongoimport --d text8 -c text8 --file text8.json ```Zliczanie wszystkich słów
```js db.text8.count()Rezultat: 17005207
<p>Zliczanie różnych słów</p>
```js
db.text8.distinct("word").length
Rezultat: 253854
1 najczęściej występujące słowo
```js var start = new Date().getTime();db.text8.aggregate( {$group:{ _id:"$word", count:{$sum:1}}}, {$sort: {count: -1}}, {$limit:1})
var end = new Date().getTime(); var time = end - start; print(time);
```js
Rezultat: 1061396
Stanowi: 6,24%
Czas: 23 sekundy
10 najczęściej występujących słów
```js var start = new Date().getTime();db.text8.aggregate( {$group:{ _id:"$word", count:{$sum:1}}}, {$sort: {count: -1}}, {$limit:10})
var end = new Date().getTime(); var time = end - start; print(time);
```js
Rezultat: 4205965
Stanowi: 24,73%
Czas: 22 sekundy
100 najczęściej występujących słów
```js var start = new Date().getTime();db.text8.aggregate( {$group:{ _id:"$word", count:{$sum:1}}}, {$sort: {count: -1}}, {$limit:100})
var end = new Date().getTime(); var time = end - start; print(time);
```js
Rezultat: 7998978
Stanowi: 47,03%
Czas: 22 sekundy
1000 najczęściej występujących słów
```js var start = new Date().getTime();db.text8.aggregate( {$group:{ _id:"$word", count:{$sum:1}}}, {$sort: {count: -1}}, {$limit:1000})
var end = new Date().getTime(); var time = end - start; print(time);
```js
Rezultat: 11433354
Stanowi: 67,23%
Czas: 25 sekundy
Do rozwiązania zadania użyłem danych znajdujących się pod tym linkiem (http://www.poipoint.pl).
[Baza](/data/lpaczynski/Szkolywyzsze.json) zawiera dane dotyczące szkół wyższych w Polsce.Import do mongo
```bash mongoimport -d geo -c schools < Szkolywyzsze.json ```Gdańsk 54.360, 18.639
Łódź 51.783, 19.466
Warszawa 52.259, 21.020
db.schools.find( { loc : { $near :
{ $geometry :
{ type : "Point" ,
coordinates: [ 18.639, 54.360 ] } },
$maxDistance : 10000
} }, { _id: 0 } )
db.schools.find( { loc : { $near :
{ $geometry :
{ type : "Point" ,
coordinates: [ 19.466, 51.783 ] } },
$maxDistance : 10000
} }, { _id: 0 } )
db.schools.find( { loc : { $near :
{ $geometry :
{ type : "Point" ,
coordinates: [ 21.020, 52.259 ] } },
$maxDistance : 10000
} }, { _id: 0 } )