Article
0 comment

How to merge two WordPress blogs

Introduction and Overview

For some of you it might be pretty obvious how to do that. But for some of my readers this might be a new topic. So here is a short overview of how to do it:

  1. Test if it works:
    1. Prequisite: you’ll need a locally running web server with PHP support. If you don’t have one, you could try to test the merge on a second web server, but alas that’s out of the scope of this posting.
    2. Download the destination blog and install it locally.
    3. Install the WordPress Command Line Tool.
    4. Download all articles from the source blog as XML file.
    5. Install the WordPress Import plugin.
    6. Try to import the XML file.
  2. If all works well, repeat that (without step 3 since the URLs are ok for production) in the production instance of the destination blog.

Local test

Download destination blog

First we need a download of the blog, where all postings should be merged together. This means:

  • Zip or tar the whole WordPress directory together, get it down to your machine.
  • Install it as a virtual host on your local web server.
  • Get a full export of your WordPress database.

My WordPress directory was called “www” and resided in /opt/sites/de/technologyscout (that’s how all my web server document roots  are organized /opt/sites/TLD/DOMAIN/SUBDOMAIN). So I downloaded it to my laptop, moved it to /opt/sites (yes, I maintain that also locally) and renamed it to “techscout”.

If you’re like me, it’s a good idea, to look up the database credentials in WORDPRESSROOT/wp-config.php:

I also like to have exactly the same credetials locally, so at the MySQL command line I do:

Then I import the downloaded WordPress database with:

 

Install WordPress Command Line Tool

Since WordPress has a habit of saving absolute URLs in the database, which is btw. a very bad and stupid habit, we need to patch those URLs to work locally. This is done with the indispensable wp-cli tool:

This will replace every occurrence of http://www.technologyscout.de with http://techscout. Now please try to log in with your credentials. Everything should work locally now. Please have a look at the URL in your browser after login. If you see the productive URL (for me http://www.technologyscout.de) this means the search and replace didn’t work as expected.

Download XML archive with all postings

Please go to Tools -> Export in the admin and select “Posts”. You’ll see additional options. I selected:

  • Categories: All
  • Authors: All
  • Start date, End date: Nothing, just go with –Select–
  • Status: All (You can only import published posts, if you like)

Now click on “Download Export File” and save the file locally.

Install WordPress Import plugin

Now please go to Tools -> Import inside the admin panel. You will see a list of options similar to this one:

Importoptions

Please select the last entry called “WordPress” (who could guess that, right?). If you didn’t have the WordPress import plugin installed WordPress will ask you if you would like to do so right now. We certainly want to. After installing the plugin, we are ready to …

Import the WordPress XML file

Proceed by selecting the input file we just downloaded. Everything should work smoothly. The imported postings should be sorted according to their original date into the database.

Do it in production

It’s a good idea to get a database backup of your production destination database before importing the blog posts. Then go to Tools -> Import, install the import plugin if needed, and import the XML file we already used locally.

That’s all. Have fun!

Article
0 comment

Blogumzug – Blog move

Deutsch

Hallo, vielleicht wundern Sie sich, daß Sie auf dieser Seite landen, obwohl Sie die deutsche Version sehen wollten. Ich habe festgestellt, daß es auf Dauer eher unsinnig ist, zwei Blogs mit ähnlichen Inhalten zu verwalten und habe daher die beiden Blogs zusammen gelegt. Die Inhalte von technologyscout.de finden Sie jetzt auch hier auf der Seite.

English

Hi, you might wonder why you got here instead of seeing the german version you expected. I realized, that it is a bit of a hassle to support two blogs with very similar content, so I merged them. So now you can find the content from technologyscout.de in here.

Article
0 comment

Practical tips for using map()

When using map() you sometimes can be fooled by Pythons lazy evaluation. Many functions returning complex or iterable data don’t do this directly but return a generator object, which when iterated over, yields the result values.

But sometimes you will need the result set at once. For example when map()ing a list one would sometimes coerce Python to return the whole resulting list. This can be done by applying the list() function to the generator like this:

 

In line 5 I have to recreate the map object since print() seems to empty it.

When applying a standard function with map() it’s needed to qualify the module path on call:

In this case it’s the str module:

 

Thats all for now. Have fun.

Article
1 comment

Aber du liebst deinen Job doch, oder?!?

Heute würde ich mich gerne kurz mit dem Verhältnis von Arbeitgebern und Arbeitnehmern in Festanstellung beschäftigen. In diesem Bereich greift immer mehr der Usus um sich, all-incl Arbeitsverträge zu machen. Das bedeutet, darin stehen so Formulierungen wie

“Mit dem Grundgehalt gelten alle Überstunden bis zur gesetzlichen Höchstgrenze als abgegolten.”

Wenn man seinen Unmut darüber äußert, daß man Arbeitszeit leisten soll, die dann nicht gesondert vergütet wird, heißt es oft: “Oh, das geht nicht. Da haben wir ja keine Kontrolle über die Kosten!”

Um es einmal klar zu sagen:

Keine Überstunden zu vergüten bedeutet, das unternehmerische Risiko auf den Mitarbeiter abzuwälzen.

Ein Unternehmen nimmt einen Auftrag an und hat dafür eine Vergütung vereinbart, die aufgrund der Angaben des Auftraggebers abgeschätzt ist. Wenn da etwas nicht stimmt, ist das kein Risiko, daß ein Arbeitnehmer tragen sollte. Das ist unredlich.

Man kann das auch von der anderen Seite sehen: mein erster Projektvermittler als Freelancer meinte mal auf meine Einlassung: “Ach, das halbe Stündchen hab ich nicht aufgeschrieben!”:

Ihre Arbeitszeit ist das einzige Gut, daß Sie zu verkaufen haben. Verschenken Sie das nicht. Ihnen wird auch kein Geld geschenkt.

Natürlich sollte man das lieben oder wenigstens gern machen, was man beruflich tut. Und was man gern tut, da schaut man nicht auf die Minute. Aber so lange ich kein Geld für nichts geschenkt bekomme, kann ich keine Arbeitszeit für nichts verschenken. Manus manum lavat nannten das die Römer …

Article
0 comment

Sense and Sensibility of enterprise IT policies

From time to time I come across a sort of dispute or even sometimes war at companies of every size: the central IT department tries to impose a certain hardware or software policy on the coworkers they are entitled to take care of.

Every time this happens there are discussions of BYOD vs. company owned devices. The IT departments claim that they can’t guarantee a certain service level, when they don’t have access to the resources used by the coworkers. The supporters of BYOD argument that using their own chosen hard- and software augments productivity and satisfaction.

I have to confess that I’m a strong campaigner for using my own devices and software at work. But to get some insight into this topic we need to separate different requirements determined by the type of job the employees do:

  1. Office workers need to get things done. With standard tools. They often are happe to have someone to call if things don’t work like expected or needed.
  2. Software engineers use their (mostly) laptops to build software. They need some control over the environment they work in. Libraries, databases, IDEs, operating systems. They choose the tools hat get the job done. When things don’t work they are able to fix problems by themselves.

These two roughly separated requirement profiles are opposed by two sorts of enterprise environment:

  1. Proprietary systems and protocols chosen by the IT departments because they know these systems very well and know how to get support from the provider. Things in this category may contain: Microsoft products (Windows, Exchange, …) or enterprise groupware systems like Novell Groupwise, Lotus Notes etc.
  2. Open protocols and services offer similar options but with a different type of maintenance.

Both approaches require nearly the same amount of maintenance but of different types. Proprietary systems often offer poor support to clients offside of the mainstream. For example have you ever tried to connect an Apple laptop to a Novell file share? Don’t try. You’ll get mad about getting the right client tools, software incompatibilities and stuff like that.

So there is a natural match for BOYD environments: use standardized protocols and services like NFS, SMB (which both have their origin in proprietary systems …) or mail protocols like SMTP and IMAP.

If your users would like to work without tinkering with software or services: use a centralized management system. This doesn’t naturally contain closed source and proprietary tools. But often it does.

For a company with technologically apt users it’s better to adopt the BOYD way to maximize productivity and user satisfaction. The latter often is no valid point with IT service departments. Then it’s the job of the people whose job it is to provide a suitable working environment for happy colleagues to make the service departments to work they way they are supposed to work.

This seems to be a particular problem in Germany where I often enjoy contact to IT service departments featuring a very self-centric philosophy. The notion of being a service department to help others do their job is not very popular.

Several studies show that companies are seen as more attractive to new employees when they allow BYOD policies.

On the other hand there are security considerations to be taken into account. But I don’t know of any company owned system that prevents willful or even lazy security breaches.

Article
0 comment

Note to self: How to count things in Groovy collections

notetoselfThis time I would like to add a short note on how to find things in Groovy collections. Remember: collections is the general term for lists and maps, in other languages sometimes referred to as arrays or dictionaries.

Groovy has a standard method to count all elements of a collection. It is called size():

If you need to know the number of elements in a collection that fit a certain filter, it’s time to switch to count(). Count takes a closure and counts all elements, for which the closure yields true. This can bes as simple as counting all elements larger than 3:

Now what, if the elements of the list are  objects and I want to filter by a specific feature of the objects. No problem:

With maps it’s a bit more tricky. The it object inside the closure is of type LinkedHashMap$Entry, so we have to deal with its key and value attributes:

Hope that helps.  See you next time!

Article
4 comments

Der Personaler und das Digitale

In seinem Posting “Sehr kritische Gedanken zu Arbeiten 4.0 anlässlich der HR-Fachmesse Zukunft Personal” beschreibt der @Persoblogger recht anschaulich und, wie er selbst sagt, mit einem gehörigen Schuß Ironie, seine Erlebnisse und Gedanken auf und zur Mese Zukunft Personal, die er besucht hat. Diese stand unter dem buzzwordlastigen Motto “Arbeit 4.0”.

Er möchte damit seine These untermauern, daß das Personalwesen, vom Begriff Human Resources möchte ich aus Respekt vor den Beteiligten Menschen nicht reden (dazu am Schluß noch ein paar Sätze), alles andere als digital und schon gar nicht 4.0 sei.

Stilecht vorbereitet hat er sich, indem er sich eine Art Curriculum in einer Excel-Liste zusammen gestellt hat und diese dann ausgedruckt hat. Das sein ja alles sehr anti-digital und doppelte Arbeit. Ja, sehe ich genau so. Der Fehler war schon, ein Excel für diese Aufgabe zu verwenden. Ich würde das mit Evernote machen (in dem ich jetzt gerade übrigens diesen Text schreibe). Und dann hätte ich ihn auf allen Geräten, die ich so mitnehme, dabei. Ohne ihn ausdrucken zu müssen. Witzig oder?

Danach drückt er sein Mißfallen darüber aus, daß viele Teilnehmer während der Vorträge twittern. Menschen seien ja nicht multitaskingfähig. Früher, ja früher, da hätte man noch ordentlich mit Stift und Papier im Publikum gesessen und aufmerksam (1. Tätigkeit) mitgeschrieben (2. Tätigkeit). Merkste was? Spannend auch die Wortwahl. Die twitternden Zuhörer werden gar nicht als Subjekte angesprochen oder beschrieben, nur ihre Tätigkeit. Die aufmerksamen Papier-und-Stift-Zuhörer von früher, das waren Journalisten! Ja, das waren noch Zeiten! Mal abgesehen davon, daß für mich die Berufsbezeichnung Journalist immer mehr zu einem Schimpfwort wird. So wie ich seit Jahren nicht mehr “Consultant” genannt werden möchte.

Jetzt mal im Ernst, Herr Scheller: auf welchen Konferenzen waren Sie denn früher? Auf so eine, wo die Aufmerksamkeit der Zuhörer (und womöglich Journalisten!) gebannt n den Lippen des Referenten hängt, würde ich nämlich auch gerne mal gehen. Ich habe auch ein gewisses Maß an Erfahrung mit Konferenzen und Schulungen, aber eine Aufmerksamkeitsquote von 100% habe ich nirgends erlebt.

Sehr zurecht fragt Herr Scheller, warum ständig neue Säue von der HR-Industrie durchs Recruiting-Dorf getrieben werden. Die Antwort ist inhärent: weil es eine Industrie ist. Und die will verkaufen. Und verkauft wird neuer heißer Scheiß, nicht das solide und gut gemachte. Auch zurecht regt er sich darüber auf, daß Personaler entdeckt haben, daß respektvoller und professioneller Umgang mit Bewerbern tatsächlich etwas bringen könne.

Sehr schön auch seine Einlassungen zu Referenten zur Arbeit 4.0, die nicht mal ihre Powerpoint-Präsentation ohne Technikerhilfe nicht wieder starten können. Richtig klasse finde ich übrigens seine Erläuterung des Abstimmungsprozesses zum “Personalwirtschaftsaward”. Da wurden Pappkärtchen(!) mit QR.Codes(!) verteilt, die man mit dem Telefon scannen mußte, um online(!) seine Stimme abzugeben. Und dann war der lokale Internetzugang überlastet(!). Langsam gehen mir die Ausrufezeichen aus …

Nach der etymologischen Rückführung des Schokoschaumdesserts auf den großmütterlichen Schokoladenpudding schließt der Autor mit einem Appell, zwar offen für neue Ideen zu sein, aber diese immer kritisch zu hinterfragen. Dem ist nichts hinzuzusetzen und ich gehe jetzt mal schauen, wo ich einen Schokoladenpudding her kriege. Schönes Wochenende!

PS: Ach so, ja, da war ja noch das Thema der Begrifflichkeit von Human Resources bzw. warum ich den Begriff für respektlos halte. Resourcen sind im Wesentlichen Waren. Manchmal dinglicher Natur, manchmal immateriell. Menschen sind keine Dinge. Und auch keine Ware. So einfach ist das.

Article
0 comment

Note to self: Crawling the web and stripping HTML and entities on the shell

notetoselfEver tried to download a list of strings from a web page? There are numerous solutions to such problems. Here is my sort of a toolbox solution which only uses shell commands. This means it’s scriptable for many sites/urls.

In my case the HTML contained the desired list of strings, each on it’s own line, each surrounded by <b> Tags. So we can filter out all lines not starting with a <b> tag:

If you try to crawl several sites, the for loop would look like this:

This will leave us with (a) file(s) still containing HTML entities. To strip them from the file you can use a text based HTML browser like w3m:

With our for loop over sites we have several text files which all need to be filtered. Use a “triangle swap” for that:

Happy crawling!

Article
0 comment

Numbering lines with Unix

notetoselfHave you ever had a csv file and wanted to import it into a database? And you would like to add a leading ID column numbered from 0, separated by, let’s say a colon? Here’s a hint: use the Unix pr (for print) utility:

My test.csv contains a list of all world manufacturer ids (WMI) for car VINs (vehicle identification number). the first few rows look like:

Please note that column headers are added later on. Now the output looks like this:

Now for the curious: what does the command line do?
First for the pr part:

  • -t means: omit headers (remember: normally pr is used to print paginated content …)
  • -n, means: number lines. Use colon as a separator
  • -N0 means: start with 0

So much for that part. The pr utility normally numbers lines within a given column width (standard is 5 chars). This results in leading whitespace. We don’t want that, so the sed command removes spaces and tabs at the beginning of the line.
Enough Unix magic for now. Happy hacking!

Update: Detlef Kreuz just mentioned on Twitter, that this task could also be accomplished with awk:

Here awk executes the commands inside the curly braces for every line of input. Each line will first print the line number minus 1, followed by a colon and the complete line. $0 is an internal awk variable containing the complete currect line, while $1, $2 … contain the split up fields (where to split is determined by FS, the field separator, which defaults to a space). Thanks Detlef!

Article
0 comment

Note to self: How to use screen

notetoselfThis posting will start a series of rather short articles, where I present things that I use from time to time but tend to forget how to do it :)
The first serving will deal with the undeniable useful Unix command screen. Screen can open a virtual screen, there you can start running long term processes and you can detach at any time and reattach later, while the process continues to run. You can view screen as a nohup on steroids. Start it with a blank shell and create a session with the symbolic name testo:

You are greeted with … well, a fresh and clean shell. Here you can start doing things that will run a long time. To detach from that screen, use the key sequence ctrl-a d. Nearly all key sequences for screen start with crtl-a. And the “d” stands for “detach”. To see whats going on behind your back, use the screen list command:

Here 1387.testo is the key to the session, consisting of the process id and the symbolic name:

To reattach to the screen, you might have guessed it, you can use a screen reattach:

You can detach and reattach to the screen as often as you like. When done with your long running processes, just log out of the screen using ctrl-d. You will be informed that the screen has been shut down: