Rozmiary współczesnych danych w Internecie i na naszych dyskach zmuszają nas do zastanowienia się nad limitami związanymi z konstrukcją nośników. O ile kiedyś, za czasów kierownictwa Billa Gatesa możliwość skompresowania sterty papierów do małej płytki CD wydawała się niesamowita, o tyle teraz tradycyjne nośniki przestają powoli odpowiadać na światowe potrzeby. Z tego powodu Microsoft eksperymentuje od paru lat z pamięciami alternatywnymi, takimi jak DNA. Teraz firma prezentuje swoje osiągnięcia.
DNA nie tylko oferuje wysokie zagęszczenie i bardzo długoterminowe rozwiązanie przechowywania danych, ale też wymaga niewielkich nakładów energii w spoczynku w porównaniu do dzisiejszych technologii przechowywania danych. Poza tym na skutek przełomów technologicznych znacząco spadły koszty syntezy DNA i odczytu danych. Korzystając z dostępnych technologii, naukowcy z Microsoftu i Uniwersytetu Waszyngtońskiego zademonstrowali pierwszy w pełni zautomatyzowany system do przechowywania i pozyskiwania danych w sztucznie wytworzonym DNA. Można powiedzieć, że jest to kluczowy krok w przeniesieniu tej technologii z laboratoriów badawczych do komercyjnych centrów danych. Zespół z powodzeniem zakodował słowo "hello" we fragmentach wytworzonego DNA i przekonwertował je z powrotem do formy cyfrowej, używając w pełni zautomatyzowanego systemu end-to-end, który to opisano w nowym artykule opublikowanym dziś w „Nature Scientific Reports”.
DNA może przechowywać cyfrowe informacje w formie znacznie mniejszej (fizycznie) niż ta, której używają dzisiejsze centra danych. Jest to obiecujące rozwiązanie dla magazynowania w obliczu eksplodujących wręcz ilości danych, generowanych na świecie każdego dnia. Microsoft postawił sobie za cel zamknięcie nadchodzącej luki, dzielącej ilości produkowanych danych, które wymagają zachowania, i możliwości ich przechowywania. Zawiera się w tym m.in. rozwijanie algorytmów i molekularnych technologii obliczeniowych, kodujących i pozyskujących dane z DNA, które mogłyby pomieścić wszystkie informacje, magazynowane obecnie w centrum danych rozmiarów dużej hali, w pamięci wielkości kostki do gry.
Tyle papieru można zmieścić na jednym CD - pokazuje Bill Gates na zdjęciu z 1994 r. Teraz całą halę takich płytek można (a nawet trzeba) będzie zmieścić w pamięci DNA wielkości mniejszej niż jedna taka płyta.
Dane te przechowywane są w syntetycznych molekułach DNA, które zostały wytworzone w laboratorium, nie w DNA ludzkim lub innego żywego organizmu. Mogą one być szyfrowane przed wysłaniem do systemu. Choć za obsługę tego służą zaawansowane maszyny, takie jak syntezatory i sekwencery (nie mylić z tymi muzycznymi), to wiele pośrednich kroków wymaga ręcznej obsługi w laboratoriach. Jest to jednak zbyt kosztowne, a ryzyko błędu jest zbyt duże, dlatego ważnym puzzlem w tej układance jest właśnie automatyzacja.
W odpowiednich warunkach DNA może przetrwać znacznie dłużej niż powszechne dziś technologie archiwizowania informacji, które ulegają degradacji na przestrzeni dekad. W przypadku DNA mówimy nie o dziesiątkach, a o dziesiątkach tysięcy lat - tyle bowiem przetrwało zachowane DNA wczesnych ludzi czy mamutów.
Jeśli natomiast chodzi o automatyzację, to Microsoft wraz z UW używają stworzonego przez siebie oprogramowania, które konwertuje kod binarny na elementy budulcowe DNA. Używa on niedrogiego w utrzymaniu, w większości powszechnie dostępnego wyposażenia laboratoryjnego, które wlewa odpowiednie substancje do syntezatora, który to buduje fragmenty DNA i wpuszcza je do naczynia przechowującego. Gdy system potrzebuje pozyskać informację, dodaje inne substancje do odpowiednio spreparowanego DNA i używa mikroprzepływowych pomp, by wypchać płyny do maszyny, która "odczytuje" sekwencje DNA i konwertuje je do formy, którą może zrozumieć komputer. Celem tego projektu było nie tyle wykazanie, jak szybko lub tanio może działać ten system, co zademonstrowanie, że taka automatyzacja jest możliwa. Jedną z największych korzyści posiadania zautomatyzowanego systemu magazynowania w DNA jest to, że naukowcy mogą zająć się głębszymi problemami, zamiast tracić czas na ręczne żonglowanie odczynnikami i wkraplaczami.
Naukowcy z Molecular Information Systems Lab (MISL) na Uniwersytecie Waszyngtońskim ustalili też nowy światowy rekord pojemności takiego magazynu DNA. Wcześniej wynosił on 200 MB, a niedawno udało się go powiększyć do 1 GB. W tej formie można przechowywać wszystko - badacze użyli np. zdjęć kotów, dzień literackich czy teledysków popowych. Rozwinęli oni również techniki pozwalające wykonywać znaczące obliczenia - takie jak wyszukiwanie, by otrzymać tylko zdjęcia zawierające jabłko czy zielony rower - z użyciem samych molekuł i bez potrzeby ponownego konwertowania plików do formatu cyfrowego.
Systemy komputerowe oparte na DNA - w przeciwieństwie do opartych na krzemie - muszą używać płynów, by przenosić molekuły. Płyny są jednak zasadniczo inne od elektronów i wymagają nowych rozwiązań inżynieryjnych. UW we współpracy z Microsoftem rozwija programowalny system, który automatyzuje eksperymenty laboratoryjne, sprzęgając właściwości elektryczności i wody, by przesuwać krople w siatce elektrod. Zestaw, w skład którego wchodzi sprzęt i oprogramowanie, nosi nazwę roboczą "Puddle" i "PurpleDrop" i potrafi łączyć, oddzielać, ogrzewać i ochładzać różne płyny i wykonywać protokoły laboratoryjne. Celem jest automatyzacja czynności, które są dziś wykonywane w laboratoriach ręcznie lub z wykorzystaniem drogich robotów obsługujących płyny.
Następne kroki dla MISL obejmują m.in. integrację prostego, automatycznego systemu end-to-end z technologiami pokroju PurpleDrop i tymi, które umożliwiają szukanie w molekułach DNA. Badacze zaprojektowali modularny system, pozwalający mu ewoluować, gdy wyłonią się nowe technologie syntezowania, sekwencjonowania czy pracowania z DNA.