Это они плагиатили задания из того источника, где брали мы :) . Так что не надо свой сайт брать за первоисточник :) .
Вид для печати
у меня так не работаетЦитата:
Для меня не оптимальным является способ, когда для хранения 2кк файлов, создается 2кк каталога.
на том сайте задания придумывают сами пользователи на форуме с большим обсуждением уникальности задания. так что ваш источник брал их из моего источника :)Цитата:
Для меня не оптимальным является способ, когда для хранения 2кк файлов, создается 2кк каталога.
Итак, я провел эмуляцию загрузки 2 млн фотографий через ваш, acad, скрипт. Результаты (число кол-во совпадений по каталогам, т.е. кол-во файлов в каталоге):
1 уровень вложенности
Array[16]
f => "125027"
5 => "124752"
c => "124881"
2 => "125331"
a => "124813"
7 => "124743"
b => "125651"
8 => "125108"
0 => "124946"
e => "124766"
1 => "124446"
3 => "124906"
4 => "125056"
9 => "125277"
d => "125176"
6 => "125122"
60.788446903229
2 уровень вложенности
Array[16]
9 => "7762"
7 => "7712"
0 => "7741"
b => "7912"
2 => "7726"
8 => "7830"
f => "7762"
5 => "7891"
4 => "7770"
6 => "7827"
a => "7834"
3 => "7867"
c => "7824"
e => "7837"
1 => "7940"
d => "7765"
3.8187980651855
3 уровень вложенности
Array[16]
b => "485"
8 => "487"
2 => "472"
c => "453"
f => "475"
3 => "501"
9 => "471"
0 => "484"
e => "475"
7 => "504"
5 => "522"
1 => "517"
4 => "497"
d => "486"
a => "478"
6 => "505"
0.23647403717041
4 уровень вложенности
Array[16]
b => "37"
a => "39"
1 => "19"
c => "27"
5 => "28"
f => "39"
4 => "25"
e => "31"
3 => "37"
8 => "36"
9 => "28"
7 => "34"
6 => "24"
d => "20"
2 => "31"
0 => "33"
0.015761137008667
5 уровень вложенности
Array[12]
d => "4"
e => "3"
a => "1"
2 => "3"
9 => "3"
1 => "2"
0 => "2"
b => "3"
c => "4"
f => "1"
7 => "2"
5 => "2"
0.0013048648834229
Итак, мы видим, что в среднем в конечном каталоге храниться 3 файла. Но разбежка между файлами составляет от 1 до 4. Можно ли такое хранение назвать оптимальным? Сомневаюсь. Для хранения 2 млн файлов было создано 786432 каталога. Можно ли такую идею считать оптимальной? Сомневаюсь. Вы свои коллекции (музыки, фильмов, фотографий) также храните на компе?
Ключевая фраза - придумывают пользователи :) . Кто сказал, что какой-нибудь кореец не сплагиатил задание с какой-то своей корейской книжки, вышедшей тиражом в 500 экземпляров. К примеру, задача про числа Фибонначи, это древнейшая задача. Она встречается во многих книгах по программированию. Ваш сайт к нему не имеет никакого отношения :) .
а проверьте на 100млрд? 2млн это мало. я еще до отправки решения говорил что расчитываю на максимум т.к. вы не ответили на сколько расчитывать.
кстати в любом случае видно что корреляция не большая и распределение равномерное.
это что-то вроде тестовой задачи чтобы отсеять людей которые совсем не умеют ничего :)Цитата:
К примеру, задача про числа Фибонначи, это древнейшая задача. Она встречается во многих книгах по программированию. Ваш сайт к нему не имеет никакого отношения :) .
отлично. мы уже дошли до реальной задачи. тогда введем реальную бд и оценку маркетологов про популярность продукта (чтобы знать на сколько расчитывать фотографий)
З.Ы. lvm + raid никто не отменял. размер раздела может быть и больше 2тб :)
Задача всегда была реальной. Как и задача с календаером и числами Фибоначчи. Просто взгляд на проблему был под другим углом. И вы не разглядели ее под этим углом.
Мы выяснили, что для хранения 2кк фотографий нужен диск размером 2 тб. Сделайте-ка мне рейд для хранения 100 млрд фотографий, т.е. рейд в 50 000 тб :) . И за этот рейд я должен заплатить, еще не имея ни одного клиента на своем сайте и не будучи уверенным, что раскручусь до таких размеров :) .
ЗЫ. Генерация 2кк файлов у меня заняло минуту. Я могу дать вам скрипт, запустите на ночь генерацию 100 млрд, главное время и объем памяти выставьте побольше в php.ini :) .