Начальство поставило задачу выявить спецификации тестирования, которые ссылаются на устаревшие технологические процедуры, чтобы эти процедуры обновить. Потому что внезапно пошли заказы на модели, которые уже давно не производились, китайский лаборант берется тестировать изделия, в спецификации сказано "измеряйте ток согласно процедуре такой-то", а в процедуре предлагается использовать мультиметр, которые мы давно уже списали и подарили пионерам в школу для детей-инвалидов. Понятно, что никто отбирать у детей мультиметры не хочет, а как пользоваться более новым мультиметром, в процедуре не написано. В воздухе при этом повышенная концентрация азота, и наш лаборант благополучно засыпает до конца дня. На следующий день все повторяется, и так пока не придет инженер, и не напишет Waiver - разрешение отступить от строгих требований процедуры. А инженер может долго не приходить, у него таких сонных китайцев сотня.
Проблема в том, что спецификации существуют в виде pdf-файлов, и все, на что они ссылаются, тоже указано только в этих файлах. Хотели мы когда-то сделать базу данных по этим спецификациям, но начальство сказало, что оно не хочет. Пришлось писать скриптик, читающий эти pdf. Из нескольких десятков тысяч файлов нашлось порядка сотни, из которых не удалось выудить ни строчки. Стал их обрабатывать вручную. А там... В общем, понятно, все эти файлы - отсканированные изображения. Распечатанные на матричных принтерах. 9-точечных, 24-точечных. Струйные, смазанные и растекшиеся. Первые лазерники - осыпавшиеся буквы... Некоторые спецификации составлены, когда я учился в 5-м классе и не отличил бы миксер от сплиттера. А кто-то тут уже сидел и фигачил - с удивлением нахожу на этих отсканированных листках знакомые имена. Знакомые подписи.
Проблема в том, что спецификации существуют в виде pdf-файлов, и все, на что они ссылаются, тоже указано только в этих файлах. Хотели мы когда-то сделать базу данных по этим спецификациям, но начальство сказало, что оно не хочет. Пришлось писать скриптик, читающий эти pdf. Из нескольких десятков тысяч файлов нашлось порядка сотни, из которых не удалось выудить ни строчки. Стал их обрабатывать вручную. А там... В общем, понятно, все эти файлы - отсканированные изображения. Распечатанные на матричных принтерах. 9-точечных, 24-точечных. Струйные, смазанные и растекшиеся. Первые лазерники - осыпавшиеся буквы... Некоторые спецификации составлены, когда я учился в 5-м классе и не отличил бы миксер от сплиттера. А кто-то тут уже сидел и фигачил - с удивлением нахожу на этих отсканированных листках знакомые имена. Знакомые подписи.