Słowa w ordynku. Słowa w ataku i w obronie. Pomieszane. Refrakcja słów w stali i w wodzie. Odbicia słowne i zwidy. Ład i gładkość. Spazmy i erupcje. Kojący wpływ soku z passion fruit. Od rzeczy i do rzeczy. Krótko mówiąc. Ostatnie słowo. Na początku był skowyt.
Blog > Komentarze do wpisu
Przenosiny

Wszystkich moich czytelników zapraszam do odwiedzania Migotania słów w ich nowym lokalu, na Wordpressie.

Pierwszy, dzisiejszy (4 sierpnia 2016) wpis już tam stoi. Tu pozostaną efekty mojej prawie dziesięcioletniej działalności blogowej na Bloksie. Czasami była łatwiejsza, czasami mniej, ale mniej ważne niż kłopoty administracyjne były wizyty moich bardzo cennych komentatorów. Mam nadzieję, że zechcą być ze mną i w nowym miejscu.

Administracji Bloksa dziękuję za dotychczasową gościnę i zasyłam pozdrowienia.

czwartek, 04 sierpnia 2016, andsol-br

Polecane wpisy

  • Żyć zgodnie z zasadami

    W domu leksykografa na obiad podają najpierw deser, potem sznycel, a nakoniec zupę.

  • We are not amused

    Urywek o czarnych modnych kostiumach poprzedza informacja, że nie tylkonieświnie nie siadały w kinie, ale też jadąc tramwajem ludzie nie płacili, oddającinnym u

  • Mogło być inaczej

    My Arabowie, szczególnie ci, którzy są wykształceni, widzimy z najgłębsząsympatią ruch syjonistyczny. Składamy serdeczne życzenia Żydom wracającym dodomu. Dział

TrackBack
TrackBack URL wpisu:
Komentarze
2016/08/04 06:36:37
Przeznaczenie? Też się przenoszę na Wordpressa. Też po 10 latach Bloxowania. To nie może być zbieg okoliczności... Pozdrawiam serdecznie i życzę kolejnej kreatywnej dekady!
-
2016/08/04 06:42:38
Fajna koincydencja :)

Bardzo ambitny jest Twój plan, by przenieść na nowe miejsce stare treści, i życzę Ci w tym powodzenia, ale chyba nie potrafiłbym tego zrobić z moim blogiem, najwartościowsze często były komentarze, a przenoszenie ich pomiędzy niezbyt kompatybilnymi platformami może przynieść spory ból głowy. A zresztą, to trochę wybór między życiem jutrem i wczorajem :)
-
2016/08/06 23:48:50
"chyba nie potrafiłbym tego zrobić z moim blogiem, najwartościowsze często były komentarze, a przenoszenie ich pomiędzy niezbyt kompatybilnymi platformami może przynieść spory ból głowy."

Przeniosłem kilka lat temu swojego bloga z bloxa na Wordpressa i nie był to specjalny problem. Narzędzie zwane Blex zrzuca wpisy i komentarze na komputer, można je potem zaimportować do Wordpressa i już.
Jakby co, mogę pomóc.
-
2016/08/07 01:00:34
cmoscmos, dzięki za sugestię. Nawet otworzyłem komputer z Windowsem7, ściągnąłem i zainstalowałem Bloxie, ale od razu dostałem obrazek, że "program z formatem niewłaściwym (Wyjątek 0x8007000B). No to trzeba będzie poszukać jakiegoś innego programu. Znasz coś dla linuksa?
-
2016/08/08 21:40:06
Spróbuję czegoś poszukać albo znaleźć inną możliwość. Odezwę się wkrótce.
-
2016/08/08 23:12:36
Z tak zwanej góry dziękuję. W międzyczasie na wszelki wypadek ściągam wszystko
wget-em - myślałem, że komenda

for i in `seq 1 181`; do wget -nc -c -l 5 -r andsol.blox.pl/html/1310721,262146,169.html?$i;done

załatwi całość, ale okazało się, że na niektórych wpisach zacina się i muszę je "dociągać" osobno - wygląda na to, że wkrótce całość będę miał u siebie. A wtedy dobrze by było zrobić prace oczyszczeniowe...
-
2016/08/09 11:03:15
Ten Blex loguje się jakimś interfejsem sieciowym, ściąga notki i komentarze i zapisuje w jakimś w miarę standardowym formacie który daje się zaimportować do Wordpressa. Tak szczerze mówiąc to już nie pamiętam szczegółów i będę musiał pogrzebać na starym dysku, znaleźć jak to zrobiłem i spróbować ściągnąć jeszcze raz resztki mojego bloga z Bloxa. Jak to pójdzie a nie będzie iść u Ciebie, to mógłbym ściągnąć Twój blog i podesłać Ci gotowy plik (wymagać to będzie trochę zaufania do mnie i podania mi hasła). Ale może znajdę jakąś inną możliwość.
-
2016/08/09 13:36:50
Ależ jasne, że zaufam, gdy zechcesz podam dane przez emaila. Twoje rozwiązanie - jak mówisz - pozwala importować rzecz na WP, a wget daje tylko wierną kopię u mnie na komputerze, ale z dużą ilością śmiecia. Nawiasem, chyba rozumiem, czemu nie ciągnie wszystkiego: przy rekursywnym przeszukiwaniu ma zapewne wbudowany jakiś limit (praktyka sugeruje, że to 300 plików), po osiągnięciu go oznajmia, że "za dużo otwartych plików".

Boziu, Boziu, ile tego nazbierało się przez te lata... Odkrywam tam wśród komentarzy świetne wierszyki Bobika i smutno się robi, że nie ma już Kingi.
-
2016/08/11 05:42:22
cmoscmos, przyglądając się uważnie pościąganym materiałom widzę, że pomysł zachowania całości i wrzucenia jej w jakieś nowe miejsce byłby nadmiarem megalomanii.

W lekkich bólach (w ostatnich czasach nie bawiłem się skryptami w bash czy sed-em) przypomniałem sobie jak oczyszczać wpisy w całych katalogach ze śmiecia, wtedy niesłychanie to się pomniejsza, średnio z 30 KB do 5 KB, z zachowaniem w pełnym szacunku wszelkich komentarzy - i trzeba będzie spokojniutko, powoli (łoboziu, ponad 2600 wpisów) powyrzucać co jest wyrzucalne i poukładać w paczuszki co ma sens (wniesiony przez komentatorów czy autora). A oryginał na Bloksie chyba jakiś czas poleży, bo nie sądzę, by tu się jakaś globalna katastrofa szykowała.

Ale za dobre chęci szczerze Ci dziękuję, to miłe, że są ludzie myślący, że warto by było to zachowywać.
-
2016/08/24 14:39:53
Interfejs o który opiera się Blex został wyłączony. Jak znam życie nie został włączony i nie zostanie. W związku z tym, wg mojej wiedzy aktualnie nie ma cywilizowanej metody na backup na Blox.

Jeśli chodzi o backup, polecam mój opis backupu bloga (wget).

Jeśli Ci zależy, to mogę popatrzeć, bo robiłem przymiarkę do eksportera Blox -> Blogspot. Poległem na... braku dokładnego opisu XML Blogspota i enigmatycznych komunikatach błędów oraz braku motywacji. Ciut o tym pisałem w rozie.blox.pl/2015/08/Wattmeter-nowy-projecik.html W przypadku WordPressa powinno być dużo prościej, a zasadnicza część skryptu (parsowanie treści Blox) już jest - zmienia się tylko wyjście na wordpressowy XML. Przypominaj/motywuj.
-
2016/08/24 19:13:29
rozieblox - wielkie dzięki za chęć pomocy i za konkretne sugestie. Motywujesz mnie do rozpisania się jak już :) rozwiązałem problem; nie zrobił tego jeden elegancki skrypt. Wyjaśnienie jak to zrobiłem może komuś się przyda. Więc poniższe uwagi na pewno nie są dla Ciebie czy dla innych ludzi radzących sobie z informatyką, ale dla laika chcącego zrozumieć czemu taką właśnie ścieżkę wybrałem.

Ale przed wyjaśnieniem jak parę słów o tym po co. Ano, blog był administrowany tylko przeze mnie, ale w istocie prowadzony przez wiele osób, które czytały i komentowały, nieważne: życzliwie czy nie tak bardzo, istotnie czy z dygresjami . I uważam, że zrobienie jakiegoś poręcznego archiwum (niekoniecznie naśladującego strukturę Bloksa) to wyraz szacunku dla nich. No i moja korzyść, bo jest tam w komentarzach wielkie bogactwo i tematyczne, i językowe.

Oczywiście podstawowe narzędzia to wget - linuksowy program do ściągania, sed - arcypożyteczny program do krojenia, wyrzucania, zastępowanie itp., oraz prościutkie skrypty w bash.

Wstępną trudnością jest system archiwizowania Bloksa (zapewne byłby powodem rozpaczy maszyn indeksowania gdyby przejmowały się Bloksem) polegający na tym, że wpisy mają podwójne adresy; jeden prosty typu
jakasnazwa.blox.pl/rok/miesiac/wpis.html - i to się nie zmienia, i dociera się tym do wpisu z komentarzami, ale jest też drugi w stylu
jakasnazwa.blox.pl/html/okropnynumer.html?n
gdzie są tylko wpisy, do komentarzy dociera się klikaniem, i to n zmienia się bezustannie. Najnowsze wpisy lądują do pliku z n=1, a dawniejsze są spychane do coraz większego n. U mnie to n przebiega od 1 do 181 (no tak, prawie 10 lat i duże gadulstwo).

krok 1. Ściągam wszystko, bez rekursji, tylko z opcją -nc (nie powtarzaj ściągania):
for i in `seq 1 181`;do wget -nc strasznyadres.html?$i;done

Ściąga to też kupę śmiecia. Teraz wyławianie rzetelnych adresów z plików w katalogu
gdzie zostały wsadzone (a skąd reszta jest od razu wyrzucona):

krok 2. for i in *; do grep Link $i >> spis; done

krok 3. Wyrzucam wszystko ściągnięte, plik "spis" oczyszczam z "administracyjnych poleceń".

krok 4. wchodzę do www.blox.pl do moich resource, zapisuję listę zawartości w pliku, w który dodaję na początku każdej linii "jakasnazwa.blox.pl/resource/ i ściągam wszystko z opcją "-i" ładując do katalogu "resource"

krok 5. Plik "spis" tnę na mniejsze, miesięczne, wget idzie dla nich z opcjami "-nc -r -l 1", przed uaktywnieniem kolejnego miesiąca wyrzucam co wget "awansem" ściągnął mi dla niego - te pliki są źle zapisywane, ze zmianą kodyfikacji.

krok 6. Skryptem bash z poleceniami w sed czyszczę pliki z całych lat zachowane w katalogach rocznych, typowe polecenie wyglądają tak (przebiega się tam wpisy z całego miesiąca):

for i in *;do sed -e '/<link rel/d' $i> $i.1;mv $i.1 $i;done

for i in *;do sed -e 's,div class="TytulKomentowanegoWpisu",h2,' $i> $i.1;mv $i.1 $i;done

for i in *;do sed -e '/h2/s,div,h2,' $i> $i.1;mv $i.1 $i;done

- tu każdy dostosowuje rzecz do własnego zamysłu. Ja wyrzucam wszyskie przekierowania do następnych/poprzednich wpisów i wszystkie gwizdki.

krok 7. Ciężka i długa praca (może potrwać miesiące) poprawiając błędy z linkami podanymi w komentarzach itp. i grupując wpisy tematycznie (ad libitum)

krok 8. Robienie paczuszek używając wkhtmltopdf.

Typową paczuszkę (w roboczej wersji) wstawiam tutaj:
andsol.blox.pl/resource/obrazki.pdf .

Well, that's that.
-
2016/08/24 21:36:53
Ojoj. To jakoś mi na półręczną wersję wygląda i żal mi patrzeć jak się męczysz. Więc się nie męcz, poczekaj z... 10 dni. Najdalej w przyszły weekend powinienem mieć chwilę wolną (do środy raczej na pewno nie).

1. Blox daje sitemap.xml ( andsol.blox.pl/sitemap.xml ). Tam masz URLe wszystkich wpisów. I daty publikacji (choć nie stąd biorę, a byłoby lepiej).
2. Iteracja po URLach i proste łuskanie regexpem tytułu, treści, daty. Oraz dla komentarzy - autor, data, treść komentarza.
3. Zwinięcie wszystkiego w stosowny XML, który można zaimportować na docelową platformę tak, że będzie wyglądał jak dodany tam na miejscu, z zachowaniem autora, daty. Jedyne co mogę gubić, to URLe do stron autora, jeśli podane, ale to chyba niekrytyczne.
Całość owinięta Perlem, ~210 linii kodu.

Problem jest taki, że to wczesna przymiarka i pod Blogspot, więc nie wykluczam błędów, chociaż proste testowe wyglądało OK, tylko problem ze specyfikacją Blogspotowego XMLa był. Ale plan ogólnie był taki, żeby skrypt upublicznić, bo Blox w tej chwili nie wspiera w żaden sposób "ucieczek", co mi się ideologicznie nie podoba.
-
2016/08/24 21:57:38
Tak, to jest półręczna wersja, ale to już dawno jest zrobione :) Chyba w dwa czy trzy dni miałem wszystko ściągnięte i pooczyszczane - i wcale nie żałowałem sobie, że nie było to spięte w jeden skrypt, bo przyglądając się szczegółom lepiej pojmowałem co tak naprawdę chcę z tym zrobić, co i jak zachować. To była taka praca dająca feedback od rzeczywistości, a nie tylko automat do ściągnięcia tego. Ale jak będziesz miał skrypt to bardzo chętnie zobaczę, bo co się człowiek nauczy to kiedyś może być jak raz. Nawiasem, gdy miałem 16 lat, uczyłem się "po nic" hiszpańskiego, potem zarzuciłem, bo to było po nic, ale gdy trzeba było zacząć mówić po portugalsku, okazało się, że i kilkaset rdzeni i nieco konstrukcji gramatycznych znam i rozumiem :)

Tak, ze spisem zawartości bloga to prościej, ale wtedy po prostu nie pamiętałem tego. Ale nie wydaje mi się, że tam wszystko stoi.

A z treścią komentarzy, to nie może być prosta sprawa, bo na przykład o wpisach czasami telemach mnie pytał "a o czym to?" Tu wkraczamy chyba na teren AI.

Co do "ucieczek", gdyby lepiej dbali o moich komentatorów i o mnie, to przecież bym nie uciekał... Parę razy po prostu głupio zagrali, jakieś "propozycje współpracy", że niby będą publikować w internetowym wydaniu Gazety moje teksty - ale w praktyce okazało się, że idzie to jako "listy od czytelników" i z zupełnym schrzanieniem strony graficznej. Czyli nie chcą mi zrobić reklamy, owszem, zaakceptują, że dostaną darmowego współpracownika, ale będzie on "pisał listy"?

No ale dlaczego też mieli by hołubić człowieka, który wprawdzie czasami Frondzie przysoli, ale i GW często się nabija?
-
Gość: kwik, *.neoplus.adsl.tpnet.pl
2016/08/25 01:08:03
To jest wszystko trochę smutne, bo jeszcze kilka lat temu (2009) dawało się łatwo wyeksportować dane z bloksa, tak to przynajmniej wyglądało. A Google reklamował wtedy swojego blogspota hasłem Twój blog, Twoje dane, dawali też narzędzia do konwersji we wszystkie strony: google-opensource.blogspot.com/2009/01/google-blog-converters-10-released.html (jak łatwo sprawdzić ostatnia wersja jest z maja 2010).
Dziś www.dataliberation.org przekierowuje na jakąś pomoc od Google, a na blogspocie zmienili nawet podpis na guziku, było Eksportuj, jest Utwórz kopię zapasową (ale format ten sam, jak sądzę).

Ale nie ma co się martwić, blogi to przeżytek, teksty dłuższe niż kilka zdań są przecież niestrawne dla nowego człowieka z attention span na poziomie ryjówki.
-
2016/08/25 01:46:41
Nic o ryjówkach nie wiedziałem (to znaczy poza tym, że mają krótką pamięć, co właśnie od Ciebie usłyszałem), a wikipedia pokazuje, że to olbrzymia rodzina. Widzę, że nadawała by się na godło PiS-u - duży apetyt z potrzebą natychmiastowego zaspokojenia go. Może by otworzyć konkurs na wyhodowanie sorex pisiensis?
-
Gość: kwik, *.neoplus.adsl.tpnet.pl
2016/08/25 02:16:02
Ryjówki jednakowoż są pożyteczne.
-
2016/08/25 09:25:20
@andsol-br Jeśli nie ma błędów, to w sitemap.xml jest wszystko. Powinno być, bo taka jest idea sitemapy... ;-) Patrzę i u mnie nawet statyczne strony i kategorie są, ale to może wynikać z nowego szablonu.

U Ciebie w sitemap widzę 2705 wpisów, łącznie z główną stroną, czyli tak naprawdę 2704. Tyle samo pokazuje Ci w panelu?

Jeśli chodzi o "nieprzydatne" rzeczy, to zgadzam się, tylko tu raczej musielibyśmy mówić o programowaniu w danym języku. W sumie zbliżone do nauki języka.

Z komentarzami jest tak, że patrzę nie na treść, tylko na strukturę HTML i po tym rozpoznaję, więc da się bez AI. A Blox jest na tyle miły, że nie pozwala na dowolne tagi HTML w komentarzach, a w zasadzie ogólnie zamienia znaki < i >, zarówno w treści, jak i komentarzach, na HTMLową reprezentację. Raz do czegoś ta nieszczęsna funkcja mi się przydała, bo nerwów straciłem wiele przez nią w swoim czasie...

Jeśli chodzi o zaplecze Blox to... jest jak jest. Mnie na szczęście nie dotykają kwestie braku dostępu, ale tak, logika działania jest dziwna. Dziwne limity na pewne rzeczy (np. ilość tagów), dziwne zabezpieczenia (wycinanie wspomnianych < i > czy komunikat o zbyt szybkim wpisaniu komentarza nawet, gdy jest się zalogowanym). Wyszukiwarka działa jak działa... Dla starego szablonu (z którego korzystasz) stworzono nieszczęsną dedykowaną wersję mobilną, z wbudowanymi reklamami, których wyłączyć nie sposób.
Ale są też zalety - generalnie działa, kontrola jest niezła, wyszukiwarki lubią Blox, zwł. na nowym szablonie, nie ma problemu z dostępnością na urządzeniach mobilnych. Inna sprawa, że dziś raczej bym tu bloga nie założył już.

Propozycje współpracy - cóż, prawda jest taka, że cały Blox to dla Agory generowanie darmowej treści, którą można czasem gdzieś wykorzystać, by klikalność była większa.

@kwik Tak, był common speech blogowy czyli chyba właśnie BlogML (w ciekawe miejsce linkuje teraz z podanego przez Ciebie wpisu...) i Blox korzystał dokładnie z tego samego API z tego co pamiętam. Na Blogspocie eksport działa i są narzędzia do konwersji między Blogspot a Wordpress. Ogólnie WP i jego formaty robią teraz za common speech.

Więc w sumie eksport do WP jest chyba najlepszym rozwiązaniem.
-
2016/08/26 08:24:47
Zadałem pytanie na forum o Blox, zobaczymy co administracja odpisze. forum.gazeta.pl/forum/w,8,162248746,162248746,Eksport_bloga.html
-
2016/08/26 16:32:18
rozieblox - po pocięciu pliku na miesięczne kontrybucje blogowe wyrzuciłem go (taka ostatnia mania, żeby nie trzymać zbędnych rzeczy, więc i te miesięczne kawałki o ile wykorzystane przez rozstawienie do tematycznych grupek, wyrzucam), ale było chyba właśnie tyle tego, 2704. Potworne. Trzeba nauczyć się trzymać dziób na kłódkę.
-
2016/09/01 06:49:51
Zacząłem przymiarkę i... będzie ciężko. Mam napisany eksporter, ale pod nowe szablony wyłącznie. Plus WP ma trochę inną koncepcję eksportu, ale to mniejszy problem.
-
2016/09/02 16:51:28
rozieblox - no to całe szczęście, że wszystko już jest w domu. Ale zaczęły się inne schody - próba archiwizowania nowych wpisów na WP pokazuje, że tam cała struktura wpisu i komentarzy jest odmienna. Czy oprócz dość prostackiego 'w3m -dump' jest jakaś prosta metoda zapisywania treści wpisów wraz z komentarzami stamtąd?
-
2016/09/09 07:11:18
@andsol-br WP ma wbudowany eksport i poza tym są do tego pluginy, całkiem fajne zresztą. Natomiast tak, struktura w eksporcie jest zupełnie inna. Chyba, że mówisz o backupie "jak widać", wtedy wget którego gdzieś wyżej/obok podsyłałem powinien zrzucać wszystko. Bez podziału na treść i komentarze, jednak.






PT KOMENTATORZY, wiedzcie: wyrzucam (prawie) wszystkie komentarze gdy link z ksywki prowadzi do działań komercjalnych. To jest blog psa ogrodnika: sam nie zarobię tu i innym nie pomogę.