09:22

Неизвестный смайлик.
[-]

Я знаю, что есть программы, которые сравнивают два изображения и показывают, одинаковые они или нет, в конце концов эту програмку на коленке даже на паскале не сложно написать.

А вот посоветуйте какая бы программа помогла бы мне в решении следущей проблемы:

У меня есть огромная папка (почти 400 гигов) музыки, есть серьезные основания полагать, что там довольно много одинаковой музыки - так как эта коллекция собиралась от разных людей и практически не сортировалась.

Ну и естественно мне бы хотелось чуток ее поуменьшить поудаляв одинаковую музыку.

 

Было бы идеально если бы программа во первых сравнивала названия (это наиболее простое), сравнивала содержимое (собственно о чем и прошу) и совсем хорошо было бы если бы она могла бы каким-то образом определять похожесть файлов. К примеру, в коллекции КИНО, у меня три разных варианта "Когда твоя девушка больна", по большей части они похожи, разное вступление только. По идее, программа должна сравнивать блок части (хоть по МД5 сумме или еще как) файлов и выдавать, что к примеру файл 1 и файл 2 похожи на 70%.

 

 

UPD и посоветуйте перекодировщик из аер и флак в мп3, а так же из мкв в ави. И еще мануал по этим перкодировщикам )



Комментарии
25.04.2009 в 15:08

1. на самом деле определять "похожесть" звуковых файлов -- изрядно нетривиальная задача. не исключено, что таких программ нет совсем.
2. перекодировать музыку удобнее всего фубаром.
3. мкв и ави -- не кодеки, а контейнеры. слово "перекодировка" в данном контексте выдаёт в вас нуба. так вот, возможности мкв превосходят возможности ави (особенно в части хранения субтитров и авц), поэтому данное действие может вообще быть неосуществимым, всё зависит от конкретики.
25.04.2009 в 15:42

Неизвестный смайлик.
ehlo_kitty
1) Чем принципиально отличается от сравнивания картинок? те же блоки информации, разве нет? Другое дело, сравнивание не точное, а приблизительное - вот тут я согласен, надо потупить и вспомнить как там этот звук образуется.
2) точное название можно? )
3) Да я нуб, поэтому и прошу мануал, чтобы перестать им быть. Мне нужно следующее: У меня есть штук двадцать фильмов каждый из которых 9-12 гигов весит в мкв. На моем не сильно мощном ноутбуке эти фильмы проигрываются с тормозами. Я хочу их переделать таким образом, чтобы они уменьшили свой размер и начали проигрываться нормально. Возможно нет смысла переделывать в ави, можно оставить и в мкв.
25.04.2009 в 17:53

1. рекомендую немного подучить матчасть. даже если забыть о компрессии, достаточно небольшого изменения одного параметра, чтобы получить абсолютно разный набор бит. то есть сравнивать нужно не файлы, а музыку. другими словами, вам понадобиться некий робот, который будет эту музыку "слушать". мд5 тут вообще не при делах.
2. у вас есть несколько вариантов штоле? foobar2000.org
3. манулалы в интернете. можете начать с педивикии. серьёзно, не пожалейте пары часов, почитайте теорию.
25.04.2009 в 19:58

ಠ-ಠ
1. на самом деле определять "похожесть" звуковых файлов -- изрядно нетривиальная задача. не исключено, что таких программ нет совсем.
Очень близкая к описанной софтина точно есть, у меня коллега с ее помощью мелодии для мобильника искал, названия которых не помнил. Напеваешь мотив коммуникатору или компу в микрофон, софтина лезет в сеть и говорит название и исполнителя. В душе не знаю, как работает, и, к сожалению, не помню названия.
26.04.2009 в 10:46

Тотальная неудачница и убийца жёстких дисков.
Паломник Оптимизма!

В foobar2000 была какая-то функция сравнения музыки. Лично я её ни разу не использовала целенаправленно, но помню, что долго что-то там сканируется.
27.04.2009 в 10:38

подозреваю, для решения данной задачи достаточно будет просто найти дубликаты файлов (возможно с разными названиями)
27.04.2009 в 12:27

Тотальная неудачница и убийца жёстких дисков.
Enkryptor

Не, там именно разные файлы, которые отличаются прочентов, скажем, на 90...
27.04.2009 в 12:57

Тогда, наверно, никак. Даже при отсутствии различий на слух данные в этих файлах отличаются полностью (т.е. на 100%)
27.04.2009 в 13:04

Тотальная неудачница и убийца жёстких дисков.
Ну, человек хотела акустический парсер ^^ Чтобы сравнивались не байты, а звуки ^^
27.04.2009 в 14:30

и/или
Мне такие разработки известны, но не в широкой продаже.
27.04.2009 в 15:14

Тотальная неудачница и убийца жёстких дисков.
Как они называются и как их найти? ^^
27.04.2009 в 15:26

и/или
найти легко — например, cвоя разработка используется в продакшн у www.moskva.fm/
27.04.2009 в 17:42

< Хроническое исключение > Когда все считают, что ты маленький, белый и пушистый, не спеши показывать свои когти и зубы
А программы которые бы сравнивали mp3 по контрольным суммам, но без учёта записаных тегов кто нибудь видел?
Приходится перед сравнением делать копии со всех mp3, убивать в них теги, а затем сравнивать. После приходится уже шерстить оригиналы, при ~25к файлов это несколько напрягает
27.04.2009 в 18:11

дались вам эти контрольные суммы. вопрос очень простой: если хотите порядка в коллекции, будьте бобры навести его руками. тэги, обложки, имена файлов, всё такое. либо можете оставить помойку, дисковое пространство нынче дешевле грязи.
27.04.2009 в 18:24

< Хроническое исключение > Когда все считают, что ты маленький, белый и пушистый, не спеши показывать свои когти и зубы
Проблема не в месте, а в том, что на сортировку и т.д. надо много времени. и есть желание хоть немного его уменьшить.
27.04.2009 в 18:28

у того же самого фубара есть медиалиб, который сам делает всё что нужно.
28.04.2009 в 03:58

Тотальная неудачница и убийца жёстких дисков.
ehlo_kitty

Не помню в Фубаровском медиалибе ни чего сверхестественного помимо дерева композиций и бийства ссылок на мёртвые вещи.
28.04.2009 в 07:50

а зачем нужно сверхестественное? он индексирует треки именно для того чтобы "на сортировку и т.д. надо много времени" потеряло актуальность.
28.04.2009 в 08:36

Тотальная неудачница и убийца жёстких дисков.
Ну, человек вроде как в папках хочет разобраться, а не в базе данных ^^'
28.04.2009 в 10:50

решаем проблемы с головой!
Человек уже три дня молчит.

Линда Кайе, по своему вопросу создайте, пожалуйста, новую запись в сообществе.
28.04.2009 в 10:57

Тотальная неудачница и убийца жёстких дисков.
techsupport

Я не задавала вопросов.
28.04.2009 в 11:09

решаем проблемы с головой!
Извините.


Как они называются и как их найти?

Я принял это за вопрос.
28.04.2009 в 11:09

Неизвестный смайлик.
techsupport Я молчу, потому что внятно мне ответили, что нет и невнятно, что вроде как есть. Так как это не срочно и вообще для спокойствия души маньячного чистильщика, то я просто не стал продолжать тему.
28.04.2009 в 11:26

Ответь пожалуйста на мой невнятно заданный вопрос -
подозреваю, для решения данной задачи достаточно будет просто найти дубликаты файлов

А то вместо тебя мне ответила Линда Кайе:
Не, там именно разные файлы, которые отличаются прочентов, скажем, на 90

Как там на самом деле? Совпадают ли дубликаты, например, по размеру?
28.04.2009 в 11:31

Неизвестный смайлик.
Enkryptor
программа во первых сравнивала названия (это наиболее простое), сравнивала содержимое (собственно о чем и прошу) и совсем хорошо было бы если бы она могла бы каким-то образом определять похожесть файлов

Т.е. сравнивание дубликатов - было бы неплохо, но это самая простая вещь я и сам смогу программу написать для этого. Так что Линда Кайе права.
28.04.2009 в 11:53

Ну просто тут такая штука, что две мп3шки по звучанию полностью совпадают, просто у первой есть пятисекундное вступление, а у второй его нет, то сами бинарные данные у них могут отличаться на 100%, если их кодировали отдельно друг от друга, а не получили вторую путём отрезания куска у первой.

так что такая схема —
По идее, программа должна сравнивать блок части
тут не сработает 8((
28.04.2009 в 11:55

или одна в 192к, а в вторая -- в пресет стандарт.
28.04.2009 в 14:21

Неизвестный смайлик.
Enkryptor Это я уже понял. "Ну, человек хотел акустический парсер"(с) Линда Кайе
23.09.2009 в 18:27

краткий миг полёта
Так и не посоветовали никакой проги для ппоиска одинаковой музыки? :(
А хотя бы хорошую прогу для поиска одинаковых файлов?
23.09.2009 в 18:57

Сам такими никогда не пользовался за ненадобностью, поэтому советовать не могу. Нагуглил вот какую — www.bigbangenterprises.de/en/doublekiller/