告别BO-BLOG,转成了WordPress

今天非常成功的将BO-BLOG转换成WordPress,我很早就想转成WordPress,但是我看了周围的一些博友转换的并不是很成功,多多少少都有数据丢失,我这次从BO-BLOG转换成WordPress,可以是非常的成功。

BO-BLOG转换成WordPress程序2010下载地址:

http://u.115.com/file/f47f52f18f

但是我服务器的php不是最新版本,所以wordpress不能更新到最新版。郁闷。
bo-blog to wordpress转换的后续问题
  由于我的网赚日记已经被搜索引擎收录了一些文章,目前的流量也大多数靠搜索引擎,而转换之后肯定会对收录有很大的影响,所以做好后续工作是十分必要的,否则一旦被K,不知道什么时候才能回得来。解决收录问题最好的办法是做301转向,我在网上找了两种方法,一种是编写php代码,一种则是使用.htaccess,节选如下,以备后用:
  .htaccess法  1、更换博客主目录
  从原来Bo-Blog 的www.ZFreet.com/blog/ 换到了现在的www.ZFreet.com/ 根目录,这点对SEO 的影响其实不大。
  2、Bo-Blog 的别名URL 结构
  当我自定义了日志链接的别名时,Bo-Blog 的URL结构是这样的:www.ZFreet.com/blog/post/XXX.php;我现在的WordPress 用的别名URL结构为www.ZFreet.com/post/XXX.html ,尽可能的,我不改动别名(XXX 部分),但是Bo-Blog 的URL要区分大小写,而WordPress 不分;搜索引擎也是会区别大小写的。
  3、Bo-Blog 的伪静态默认URL 结构
  如果没有定义链接别名,Bo-Blog 默认的URL结构是这样的:www.ZFreet.com/blog/post/read.php/ID.htm,以ID号自动生成htm 文件;现在的WordPress每篇日志都有别名,不存在ID号的情况。但是,要让原来的ID号自动对应到现在的别名URL,是几乎不可能的事情,所以在写301的时候,就只有手动对应了,这个比较麻烦。
  4、Tags 的URL 结构
  Bo-Blog 的Tags 是:www.ZFreet.com/blog/go.php/tags/XXX/ ,直接是目录形式;WordPress 的是:www.ZFreet.com/post/tag/XXX/ 。不要小看这个东西,个别比较新鲜的Tags 也会成为访问入口,这个结构比较一致,容易转换。
在这次搬家过程中,301重定向要尽量满足上面的四点,才能尽可能的保住搜索流量,为此,我在.htaccess 文件里这样写道:
  
# ID
  RewriteRule ^blog/read.php/8.htm /post/repair-new-notepad.html [R=301]
  # Post
  RewriteRule ^blog/post/(\w*).php$ /post/$1.html [R=301]
  RewriteRule ^blog/read.php/(\w*).htm$ /post/$1.html [R=301]
  # Tags
  RewriteRule ^blog/go.php/tags/(\w*)/ /post/tag/$1 [R=301]
  # Feed
  RewriteRule ^blog/feed.php /feed [R=301]
  # Links
  RewriteRule ^blog/ / [R=301]

  其中的#ID 就对应到上面的第3点,得手动转换日志,然后把每一篇的别名都写一条301,幸好只转了少许的几篇,工程量还不算太浩大。
  在用了上面的301条件后,搜索引擎并不能全部保留住原来Bo-Blog 里的内容,因为很多链接都空了,会跳到404,所以那些没有手动转换的日志,会陆续的消失。
  写了301 的则会保留,依然是原来Bo-Blog 的结构,会自动跳到现在对应的日志,对访问者没有任何影响,不过排名会下降。当  我发现某篇写了301的日志无法带来搜索流量时,我就会撤掉那条301,让它们自生自灭。
  现在回看,301重定向的效果基本达到了我的需求,让想留的东西能留住(比如,但还是旧的URL),不需要的东西慢慢消失。等后面继续的逐步稳定后,我会试图删除原来所有旧的带blog/ 的抓取结果,估计完全达到平滑转换的效果,需要至少一年的时间。
  php法

  1、RSS Feed:feed.php
  对现代网民来说,RSS阅读器已经是看网页的必备工具,因此RSS种子的地址几乎是众多网址中最重要的一个。
  2、如果你懒得换也行,反正我已经重定向了。
  Bo-Blog的feed.php文件在不带参数的时候是博客正文的RSS,带参数go的时候可能是评论,也可能是分类目录的RSS,因此需要在WP根目录下建一个feed.php文件,里面对参数作简单的判断,把原来的RSS重定向到WP的RSS中。以下代码只是本博客的转向,具体怎么写要根据具体搬家结果分析。
  我的博客搬家过程中,分类数字2不知为何被搬家程序略过了,因此当分类数字为2的时候特殊处理,否则从原来的go参数中提取分类数字,传给WP的cat参数。
<!–p<br–>header(“HTTP/1.1 301 Moved Permanently”);

  2、博客阅读页面:read.php
  由于在Bo-Blog系统中我使用了链接地址优化(Rewrite),而搜索引擎收录的既有优化地址,也有动态地址,因此要判断一下地址究竟是哪种类型,然后把参数提取出来,传给WP。含有htm的地址是优化的地址,从中提取.htm之前的数字传给WP的p参数就可以到新的页面地址了。
  英文博客搬家过程中,日志的数字ID和新系统对不上,那些ID>2的日志都被+=1了,所以中间对英文日志ID作了特殊处理。变量$prefix用来判断是中文还是英文站。
<!–p<br–>header(“HTTP/1.1 301 Moved Permanently”);

  3、标签页面:tag.php
  我觉得如果没有标签的话,这世上的网页会减少一半。用site:命令在Google中一看就知道,一个小破站,却有几千个页面被搜索引擎收录,而真正的日志不过上百篇而已,那多出来的页面几乎都是各种导航页面,其中就包括标签导航。鉴于标签这么重要,原来的tag.php自然要加上、改写一下了。
  在我原来的系统中,由于标签是空格分隔,导致我只好以下划线_把一些英文字句连起来,现在WP中是以逗号分隔,而且标签有别名(空格被替换为-),因此原来的标签中,下划线要被替换为-,所以用到了str_replace()函数。在重定向之前要严重注意tag参数已经被解码了,因此需要重新编码!(即:urlencode())
<!–p<br–>header(“HTTP/1.1 301 Moved Permanently”);
if(!isset($_REQUEST["tag"])){
header(“Location: http://$_SERVER[HTTP_HOST]/cn/“);
} else {
header(“Location: http://$_SERVER[HTTP_HOST]/cn/?tag=” .
urlencode(str_replace(‘_’,'-’,$_REQUEST["tag"])));
}
?>

  4、其它页面的重定向
  我喜欢WP系统的一个重要原因就是它的各个文件分工非常明确,模板系统也是如此,所有的模板系统中都可以用一个404.php来出来404错误。除了上面三个重定向之外,大约还剩下70%的页面重定向没有完成(不要惊愕于这个工作的复杂性),如:按日期的归档、精华文章、评论页面、分类显示、附件下载和登录页面等等。由于这些页面一般都是被搜索引擎以静态地址收录的,所以不能像前面那样写PHP文件完成重定向,只能根据网址来逐个判断,把原地址转向新地址。其中有无数的细节要注意,如原来的星标日志对应新系统中的featured分类文章、两个系统的分类ID的对应关系等。综上,这个404.php便极度冗长。
  怎么知道你的网站是否有404错误呢?在WP中,只需要在404.php文件中用mail()函数往你的邮箱发报告就可以了。我将不能成功重定向的页面都发到404@yihui.name了,看看$_SERVER变量,大概就知道是哪一页出错了,以及是活人点的链接还是搜索引擎的蜘蛛人在看我的页面。
<?php 
$info = $_SERVER['REQUEST_URI'];
$prefix = substr($info, 1, 2);
 
if (strpos($info, ‘/index’)) { 
    header(“HTTP/1.1 301 Moved Permanently”);
    header(“Location: http://$_SERVER[HTTP_HOST]/”.$prefix.”/“);
} else if (strpos($info, ‘/post/’)) { 
    header(“HTTP/1.1 301 Moved Permanently”);
    $tmp = current(explode(‘_’, pathinfo($info, PATHINFO_FILENAME)));
    if ($prefix == ‘en’) { 
        if ($tmp > 2) { 
            $tmp += 1;
        } 
    } 
    header(“Location: http://$_SERVER[HTTP_HOST]/”.$prefix.”/?p=”.$tmp);
} else if (strpos($info, ‘/star’)) { 
    header(“HTTP/1.1 301 Moved Permanently”);
    $tmp = $prefix==’cn’ ? 618 : 150;
    header(“Location: http://$_SERVER[HTTP_HOST]/”.$prefix.”/?cat=”.$tmp);
} else if (strpos($info, ‘/view’)) { 
    header(“HTTP/1.1 301 Moved Permanently”);
    header(“Location: http://$_SERVER[HTTP_HOST]/”.$prefix.”/?feed=comments-rss2“);
} else if (strpos($info, ‘/category’)) { 
    header(“HTTP/1.1 301 Moved Permanently”);
    $tmp = explode(‘_’, pathinfo($info, PATHINFO_FILENAME));
    if ($prefix == ‘cn’) { 
        if (count($tmp) > 1) { 
            if ($tmp[1] == ’2′) { 
                header(“Location: http://$_SERVER[HTTP_HOST]/”.$prefix.”/“);
            } else { 
                header(“Location: http://$_SERVER[HTTP_HOST]/”.$prefix.”/?cat=” .
                    $tmp[1]);
            } 
        } else { 
            header(“Location: http://$_SERVER[HTTP_HOST]/”.$prefix.”/“);
        } 
    } else { 
        $catmap = array(’7′ => 6, ’8′ => 7, ’9′ => 9, ’0′ => 117, ’1′ => 11, ’2′ => 147,
                                          ’6′ => 12, ’10′ => 148, ’3′ => 4, ’4′ => 8, ’5′ => 10);
        if (count($tmp) > 1) { 
            if (array_search($tmp[1], array_keys($catmap)) !== false) { 
                header(“Location: http://$_SERVER[HTTP_HOST]/”.$prefix.”/?cat=” .
                    $catmap[$tmp[1]]);
            } else { 
                header(“Location: http://$_SERVER[HTTP_HOST]/”.$prefix.”/“);
            } 
        } else { 
            header(“Location: http://$_SERVER[HTTP_HOST]/”.$prefix.”/“);
        } 
    } 
} else if (strpos($info, ‘/archive’)) { 
    header(“HTTP/1.1 301 Moved Permanently”);
    $tmp = explode(‘_’, pathinfo($info, PATHINFO_FILENAME));
    if (count($tmp) > 2) { 
        if (strlen($tmp[1]) == 1) { 
            $tmp[1] = ’0′.$tmp[1];
        } 
        if ($tmp[2] < 2007 || $tmp[2] > 2009) { 
            header(“Location: http://$_SERVER[HTTP_HOST]/”.$prefix.”/“);
        } else { 
            header(“Location: http://$_SERVER[HTTP_HOST]/”.$prefix.”/?m=”.$tmp[2].$tmp[1]);
        } 
    } else { 
        header(“Location: http://$_SERVER[HTTP_HOST]/”.$prefix.”/“);
    } 
} else if (strpos($info, ‘/showday’)) { 
    header(“HTTP/1.1 301 Moved Permanently”);
    $tmp = explode(‘_’, pathinfo($info, PATHINFO_FILENAME));
    if (count($tmp) > 3) { 
        if (strlen($tmp[2]) == 1) { 
            $tmp[2] = ’0′.$tmp[2];
        } 
        if (strlen($tmp[3]) == 1) { 
            $tmp[3] = ’0′.$tmp[3];
        } 
        if ($tmp[2] < 2007 || $tmp[2] > 2009) { 
            header(“Location: http://$_SERVER[HTTP_HOST]/”.$prefix.”/“);
        } else { 
            header(“Location: http://$_SERVER[HTTP_HOST]/”.$prefix.”/?m=”.$tmp[1] .
                $tmp[2].$tmp[3]);
        } 
    } else { 
        header(“Location: http://$_SERVER[HTTP_HOST]/”.$prefix.”/“);
    } 
} else if (strpos($info, ‘/attachment’)) { 
    header(“HTTP/1.1 301 Moved Permanently”);
    $tmp = pathinfo(urldecode($info), PATHINFO_BASENAME);
    header(“Location: http://$_SERVER[HTTP_HOST]/”.$prefix.”/wp-content/uploads/”.$tmp);
} else if (strpos($info, ‘?tag=’)) { 
    header(“HTTP/1.1 301 Moved Permanently”);
    $tmp = ”;
    if (isset($_REQUEST["tag"])) { 
        $tmp = $_REQUEST["tag"];
    } 
    header(“Location: http://$_SERVER[HTTP_HOST]/”.$prefix.”/?tag=”.$tmp);
} else if ($info == ‘/’.$prefix.’/tag/’) { 
    header(“HTTP/1.1 301 Moved Permanently”);
    header(“Location: http://$_SERVER[HTTP_HOST]/”.$prefix.”/“);
} else if (strpos($info, ‘read.php’)) { 
    header(“HTTP/1.1 301 Moved Permanently”);
    header(“Location: http://$_SERVER[HTTP_HOST]/”.$prefix.”/?p=” .
        pathinfo($info, PATHINFO_FILENAME));
} else if (strpos($info, ‘links.php’)) { 
    header(“HTTP/1.1 301 Moved Permanently”);
    header(“Location: http://$_SERVER[HTTP_HOST]/”.$prefix.”/“);
} else if (strpos($info, ‘cv_yihui’)) { 
    header(“HTTP/1.1 301 Moved Permanently”);
    header(“Location: http://$_SERVER[HTTP_HOST]/cv/cv_yihui_”.$prefix.”.htm“);
} else if (strpos($info, ‘visit.php’)) { 
    header(“HTTP/1.1 301 Moved Permanently”);
    header(“Location: http://$_SERVER[HTTP_HOST]/”.$prefix.”/“);
} else if (strpos($info, ‘securitycode.php’)) { 
    header(“HTTP/1.1 301 Moved Permanently”);
    header(“Location: http://$_SERVER[HTTP_HOST]/”.$prefix.”/“);
} else if (strpos($info, ‘login.php’)) { 
    header(“HTTP/1.1 301 Moved Permanently”);
    header(“Location: http://$_SERVER[HTTP_HOST]/”.$prefix.”/wp-login.php“);

 
else { 
 
//if(array_search($ext, array(‘gif’, ‘js’, ‘png’, ‘jpg’, ‘jpeg’, ‘css’)) !== false) {
if (strpos($info, ‘/images/js’) || strpos($info, ‘/images/lightbox’) 
        || strpos($info, ‘/images/arrows’) || strpos($info, ‘/template/fighting/’) 
        || strpos($info, ‘/emot/thumbnail/’) || strpos($info, ‘/editor/ubb/’) 
        || strpos($info, ‘/images/r.css’) || strpos($info, ‘/images/others’) 
        || strpos($info, ‘/images/weather’) || strpos($info, ‘/images/weather’) 
        || strpos($info, ‘jslang.js’)) { 
    header(“HTTP/1.1 301 Moved Permanently”);
    header(“Location: http://$_SERVER[HTTP_HOST]/”.$prefix.”/“);
} else { 
    mail(’404@yihui.name’,
            “Invalid link: ” . urldecode($info),
            ‘Request page: http://yihui.name’ . $info . PHP_EOL .
             ‘Referer: ‘ . $_SERVER['HTTP_REFERER']. PHP_EOL .
              print_r($_SERVER, true),
            “From: Yihui Xie <xie@yihui.name>”);

 
?> 
 
<?php get_header(); ?> 
 
<div id=”wrapper”>
 
    <div id=”home_content”>
 
        <div>
          <p>Sorry, I’m changing my blog system now; if the page you are looking for
          doesn’t exist, please visit
          <a href=”http://yihui.name/<?php echo $prefix; ?>/”>http://yihui.name/
          <?php echo $prefix; ?>/</a>.
          I’ll fix the original links soon. Thanks!</p>
          <p><img src=”<?php bloginfo(‘template_directory’); ?>/images/mal.jpg”
          alt=”a questioning duck” />
              </p>
        </div>
 
        <div>
            <ul>
                <li>Mal the Error Duck says, “Uh oh! 404! That means the page you are
                looking for doesn’t exist, at least not anymore.”</li>
            </ul>
    <h2>Latest <?php print(isset($getOptions["num_posts"])?$getOptions["num_posts"]:”10″); ?> 
        articles</h2>
    <ul>
            <?php get_archives(‘postbypost’,
                isset($getOptions["num_posts"]) ? $getOptions["num_posts"]:10,
                ”, ‘<li>’, ‘</li>’); ?> 
    </ul>
        </div>
 
    </div>
 
</div>
 
<?php get_footer(); ?> 
 
<?php } ?>

posted @ 2012-02-28 14:28  spring3  阅读(204)  评论(0编辑  收藏  举报