【译】APP索引&SEO的下一个战场:苹果搜索 + iOS APP索引

译者定义:1. 应用页面 的原文叫“app screen”,相当于一个网页,比如你在看知乎APP中的一篇帖子,那么这个帖子就是一个“应用页面”。2. TDK的意思是“标题 描述 关键词”========================... Continue reading

SEO PUSH API(如何实现SEO元素的定制化和需求分离)

一般的大网站会划分产品,运营,销售,营销,研发等部门。其中几乎所有职能部门都会给研发部提需求,排期,上线,改BUG。营销中的SEO往往是被排在优先级靠后的位置,SEO的需求实现很慢,而出了BUG也比较靠后才会修复。为了解决这个问题,我... Continue reading

百度蜘蛛(Baiduspider)的referer

什么是百度蜘蛛的referer百度蜘蛛的referer,是指当百度蜘蛛抓取某一个URL的时候,在HTTP头中带的Referer字段。请注意,这个定义和百度最近声明去除Referer中关键词数据没有任何关系。这次讲的是spider发起的... Continue reading

如何避免大量URL重复收录

首先声明,我们只谈论有检索意义的URL,也就是用户会从搜索引擎查找的页面.其他页面按照常用的方法做屏蔽就好了.鉴于很多站长都爱讨论整体的收录量,我必须泼一下冷水,也许你的有效收录是1/10.URL参数也叫URL query,是一个最复... Continue reading

针对百度将取消referrer关键词显示接受《若兰访谈》

这次事件的影响和意义接受采访前调查了一下大家对这次事件的理解,发现这篇文章写的最好.http://qiuingseo.com/yejiedongtai/152.html不再赘述了,就是想强调一下所谓”安全”是针对百度自己,并不是让网站... Continue reading

如何保证网站长期的SEO健康度

本篇文章的意义之一,很多站长对自己网站健康状况没有头绪:在百度举办的活动上,有不少的站长会向百度工作人员提出一些根本无法回答的问题: 收录掉了,怎么办? 抓取掉了,怎么办? 流量掉了,怎么办? 排名掉了,怎么办? 收录不及时... Continue reading

使用云梯VPN的同时不影响公司局域网192.168.*.*网段的方法

以下是引用官方客服的答案:10.10.x.x 和 10.20.x.x 这两个是 VPN 网段,所以不可以添加进智能加速,否则 VPN 会无法正常工作。下面是以 192.168.x.x 为例的添加方法:在下载下来的智能加速文件夹中,找到... Continue reading

ruby 2.2.0 compile error about fiddle

when compiling ruby 2.2.0 in centos 6.4, you may meet this problem:make[2]: Entering directory `/home/work/ruby-2.2.0... Continue reading

ruby 2.1 安装openssl扩展

当下载/编译安装完最新的ruby2.1后,安装某些gem时需要openssl.基本的步骤是:cd {ruby源码路径}/ext/opensslruby extconf.rbmakemake install但当你make的时候会提示ma... Continue reading

Ruby用HTTParty调用proxy的方法

class Twitter include HTTParty http_proxy 'http://myProxy', 1080end Continue reading

周期性专题SEO原理

时效性搜索基本都是突发的,如果不提前1年做优化,临时抱佛脚就来不及了大多数时效性专题的URL不固定,导致权重无法累积所以应该保证专题URL固定, 而且把旧地址统一跳转到最新地址, 多次的专题相当于多版本网页.错误举例 http://... Continue reading

ruby常用gems介绍

#SEO/SEM* baidu* sogou* query* qihu360#酒店/POI数据* elong* baidumap* kuxun#数据库* mysql2* activerecord[activerecord-sqlser... Continue reading

Mac系统常用软件

日常使用通信: 微信 QQ输入法: 搜狗输入法Email客户端: sparrow foxmail下载: 迅雷软件商店: 迅雷Thunder Store解压缩: keka网盘: 百度网盘音乐: 虾米视频播放: mp... Continue reading

开发基本常识

#文档####sitemap协议http://sitemaps.org####HTT协议https://tools.ietf.org/html/rfc2616####markdown语法参考https://help.github.co... Continue reading

R语言统计24x60分钟的订单分布实例

ruby代码:require 'database'include DatabaseFlowStatiOrder.find_each(:batch_size => 5000) do |row| time = row['LogTi... Continue reading

R语言统计图表叠加

require(ggplot2)d2 <- read.csv('~/Documents/sort_time_sem_order_by_minute',header=T)d1 <- read.csv('~/Documents... Continue reading

安装ruby 找不到 openssl的解决办法

irb(main):001:0> require 'openssl'LoadError: cannot load such file -- openssl from /usr/local/lib/ruby/2.0.0/ruby... Continue reading

R语言按分钟统计weekday 的转化

all0 <- read.csv("~/sem1/booking_path/week0_min",header=T)all1 <- read.csv("~/sem1/booking_path/week1_min",head... Continue reading

R语言学习资料

常用资料http://cran.r-project.org/doc/contrib/Liu-FAQ.pdfhttp://www.slideshare.net/sausheong/rubyand-rhttp://docs.ggplot2... Continue reading

ruby 利用savon进行SOAP通信

#!/usr/bin/env rubyrequire 'savon'require 'pp'## baidu fengchao apiclient = Savon.client( log: false, wsdl: "https... Continue reading

git学习资料和技巧

git中文手册http://rogerdudler.github.io/git-guide/index.zh.htmlGit 入门实战https://speakerdeck.com/icyleaf/git-ru-men-shi-zha... Continue reading

利用hadoop做日志分析的实例

run.sh样本#!/bin/bashHADOOP_HOME=/usr/lib/hadoopHADOOP_STREAMING=/usr/lib/hadoop-0.20-mapreduceorderfromid='12345'srcid... Continue reading

使用sshfs将远程linux的目录映射到本机

首先安装 sshfsbrew install sshfs查看fuse4x的说明brew info fuse4x-kext执行其中的两行sudo /bin/cp -rfX /usr/local/Cellar/fuse4x-kext/0.... Continue reading

ssh免用户名登陆

实现本功能的前提是已经实现了”ssh免密码登陆”新建或者编辑配置文件: ~/.ssh/configHost machine1HostName machine1Port 22User username1Host machine2Host... Continue reading

mysql/mariadb 主从同步

配置文件是/etc/my.cnf(或/etc/my.cnf.d/server.cnf)首先检查所有数据库机器的配置中,数据库datadir的位置, 保证这个位置的owner是mysql, 即让mysql有读写权限.然后启动主库mysq... Continue reading

mysql常用操作

如果对数据精确性要求不高,可以设置读写不互锁非事务型引擎(Myisam/Aria)SET GLOBAL concurrent_insert = 2; #NEVER=0,AUTO=1,ALWAYS=2这个设置完需要定期优化表,否则会造成... Continue reading

ruby常用方法

格式化小数format("%.2f",'123.456')gem install 加速gem install gem-fast数组求平均值http://stackoverflow.com/questions/1341271/avera... Continue reading

mongodb常用操作

db.collection.update({}, {$rename: {‘field1’: ‘field2’}}, false, true);db.collection.renameCollection(‘new_collection... Continue reading

通过openssl获取https的证书

#!/bin/sh## usage: retrieve-cert.sh remote.host.name [port]#REMHOST=$1REMPORT=${2:-443}echo |\openssl s_client -conne... Continue reading

配置oh-my-zsh

安装最新版zsh 把bash换成zshchsh -s $(which zsh) 安装 oh my zshcurl -L https://github.com/robbyrussell/oh-my-zsh/raw/master/... Continue reading

linux下可执行目录解释和使用方法

以下均为本人猜测,正确理解请查阅官方资料.s表示script, bin表示可执行文件, local表示本机的, usr表示用户的/usr/local/sbin #用户自己安装的,脚本可执行文件/usr/local/bin #用户自己安... Continue reading

hadoop常用操作

参考文献http://www.cnblogs.com/forfuture1978/archive/2010/11/14/1877086.html map-reducehttp://hbtc2012.hadooper.cn/http:... Continue reading

coursera视频课程批量下载

首先安装 python以及 pip然后继续安装 coursera-dlpip install coursera-dl使用方法coursera-dl -u username -p password classname比如coursera... Continue reading

linux下开发的常用配置/命令笔记

让authorized_keys生效必须保证~/.ssh权限是700scp复制远端文件带通配符,就是需要把星号转义一下scp username@hostname:/path/to/dir/filename\* .删除文件开头BOM标记... Continue reading

sublime build problem in Mac, $PATH in Mac

There is always an error when building ruby scripts in Sublime from “Menu -> Tools -> Build”The reason is Subli... Continue reading

ruby控制程序的进程数

单进程:require 'pidfile'PidFile.new多进程:require 'pidfile'param = ARGV[0]PidFile.new(:pidfile => param)官方文档:https://git... Continue reading

ruby别名

定义类方法别名class Foo class << self def bar puts 'bar' end endendFoo.bar #output: 'bar'方法别名class Foo d... Continue reading

ruby用pry做断点调试

require 'pry'class A def hello() puts "hello world!" endenda = A.new# set x to 10x = 10y = rand# start a REPL sessio... Continue reading

三种常见变量命名规范

myVarArrays #camel capsmy_var_arrays #underscore(snake)my.var.arrays # dot separated Continue reading

Ruby 用httparty做 HTTP POST 的简易方法

require 'httparty'class PZ include HTTParty debug_output $stderr #开启debug模式, 平时可注释掉 def run self.class.post("ht... Continue reading

ruby学习资料

https://www.udacity.comhttp://www.codecademy.com/http://rubymonk.com/ruby编程最佳建议http://ruby-china.org/wiki/coding-styl... Continue reading

用activerecord处理分表结构

可以自己定义类方法, 改变表名, self.table_name=class Keyword < ActiveRecord::Base establish_connection $dbconfig['production_qi... Continue reading

面向对象的Mix-in方法

module Kkk def table_name "#{@name1}_#{@name2}_#{@name3}" endendclass Abc < ActiveRecord::Base @name1 = 'aaa... Continue reading

拿到服务器http Cookie的方法

response = HTTParty.get("http://www.baidu.com")puts response.headers["set-cookie"][0] Continue reading

ruby写shell命令的helper

OptionParser.new do |o| o.banner = "USAGE: #{$0} [options] [url]" o.on("-f", "--format [FORMAT]", "Outp... Continue reading

ruby对mongodb的常用操作

读mongodb简单方法require 'mongo'db = Mongo::Connection.new('localhost').db("friendlinks")city = db.collection('elong_hotel... Continue reading

rvm 提速

FOR MAC$ sed -i .bak 's!cache.ruby-lang.org/pub/ruby!ruby.taobao.org/mirrors/ruby!' $rvm_path/config/dbFOR LINUX$ sed... Continue reading

activerecord debug方法

ActiveRecord::Base.logger = Logger.new(STDOUT)或者ActiveRecord::Base.logger = Logger.new('/var/log/xxx.log') Continue reading

activerecord存储前会自动判断哪些字段有改动

product = Product.firstproduct.changed? #falseproduct.save #nothing happenshttp://api.rubyonrails.org/classes/ActiveM... Continue reading

ruby redis 简单用法

require 'redis'r = Redis.newr.set('key','value123')r.get('key') # 'value123'r.del('key') # 1r.del('key') # 0http://re... Continue reading

ruby 小技巧

ruby map简写threads.map(&:join)#等同于threads.map{|thread|thread.join}zerofill补零"4".rjust(2, '0') #04"%04d" % 5 #0005 Continue reading

JSON.parse处理symbol的问题

~~~rubyjson = {:key => ‘value’}JSON.parse(json) #{‘key’ => ‘value’}JSON.parse(json,{:symbolize_names => true... Continue reading

ruby的预定义变量

Some globals have actual readable names:$DEBUG # The boolean status of the -d switch.$FILENAME # Current input f... Continue reading

处理http中压缩内容

def handle_deflation case last_response["content-encoding"] when "gzip", "x-gzip" body_io = StringIO.new(last_re... Continue reading

ruby activerecord 常见使用方法(不使用rails)

dbconfig = { :adapter => 'mysql2', :username => '', :password => '', :database => '', :host =&g... Continue reading

activerecord 序列化

序列化:product = Product.firstjson = product.as_json用于更新时:row = {"id"=>12345, "name"=>"名称","updated_at"=>'2014-... Continue reading

vim configure

安装方法:http://spf13.com/project/spf13-vim安装后:在~/.vimrc中非注释的第2行加入set t_Co=256建议:删除~/.vimrc中的spell那行,这玩意注释掉都没用,用起来很恶心 如果不... Continue reading

seo system

基于ruby开发的”针对搜索引擎体验的网站分析系统 - seo oriented website optimization analysis system”,简称”SEO系统”相关工具:http://www.ruby-lang.org... Continue reading

seo book

信息检索领域相关资料 (A Guide to Information Retrieval)Organized by Hongfei YanLast updated on Sept. 16, 2009Contents Books + ... Continue reading

抓取百度搜索结果(ruby代码)

xpath解析网页代码很方便,容易维护,找到解决方法之前一直用正则处理问题的关键关键在于删除下面这个特殊符号:=============================▼Unicode编码:U+25BC维基百科注释:Black dow... Continue reading

rails取表一列的方法

请把column替换成你要的列名,把Model替换成你的model名Model.find(:all, :select => “column”).map{|x| x.column}可以在Model里加一个方法class Model... Continue reading

在rails项目中使用自定义类(自定义方法,自定义class)

一直用rake跑后台程序,发现很多rake文件的代码都是重复的,明显应该调用一个公用的方法了,查了半天,原来就这么简单1.在/lib/目录建立ruby文件/lib/testclass.rb2.编辑testclass.rbclass T... Continue reading

SEO原则

总原则简洁,规范,统一,减少维护成本,优先考虑UE,避免重复,避免歧义,避免盲目抄袭。若以下策略违反总原则,请纠正链接规范屏蔽方法—————-* 对站内链接,增加属性rel=”nofollow”* 对站外链接,增加属性rel=”ext... Continue reading

找到过度抓取的页面

将最近1个月的访问日志过滤出来,只要user-agent是Baiduspider和Googlebot的 cat * awk ‘{print $7}’ sort uniq -c ... Continue reading

美军通话实录[转]

肯定是网友杜撰的:发生在1995年10月份,加拿大纽芬兰海岸管理局人员与美国海军船舰的真实无线电通话抄本。美国海军总部在1995年10月10日公布此通话记录。加拿大人员:请改变你的航向朝南15度以避免碰撞。美国人员:建议你改变你的航向... Continue reading

哲学

1.城里人说乡下人怎么那么不文明啊,straight说gay怎么那么怪啊,没欲望的人说有欲望的人怎么那么邪恶啊,站着的人奇怪弯腰干活的人怎么会腰疼啊,任何抱怨和批判,只能代表差异,不能说明高低贵贱。2.时间就是物质衰变过程3.创造比毁... Continue reading

如何判断搜索引擎爬虫的来源

判断来源一般有4个途径:1.cookie,只适用于用户行为,浏览器需开启cookie功能,接受服务器的cookie请求2.http referer,只适用与用户行为,浏览器都会自动写这个字段3.url参数,完全通用4.javascri... Continue reading

统计用户行为的正确做法

判断用户来源一般有4个途径:1.cookie,不影响url,不精准,无额外负荷2.http referer,不影响url,不精准,无额外负荷3.url参数,影响url,精准,无额外负荷,比如http://seoaqua.com/?so... Continue reading

防止搜索引擎收录注入的办法

搜索引擎收录注入是我自己瞎编的名词。假设现在有A,B网站,还有搜索引擎CA网站由于漏洞,某类搜索功能开放了收录,一般意图是为了被C收录从而增加被检索的几率。B网站根据漏洞规则贴一批广告性质的链接,例如http://www.xxx.co... Continue reading

linux初学者笔记[转]

linux目录架构/ 根目录/bin 常用的命令 binary file 的目錄/boot 存放系统启动时必须读取的档案,包括核心 (kernel) 在内/boot/grub... Continue reading

google canonical http

详情请看官方博客(要翻墙哦):http://googlewebmastercentral.blogspot.com/2011/06/supporting-relcanonical-http-headers.html就是把原来放到htt... Continue reading

ajax页面无法被收录怎么办?

seo最基本的要求是页面可以被收录,本文适用于页面主要内容使用ajax方式加载的项目,目的只是告诉你如何向前端人员解释你的意图,即使不考虑SEO,也要慎用ajax。ajax方式如果不理解,找个前端的技术人员问一下,或者自己查资料把。可... Continue reading

多版本网页的地址管理原则

无论是离线产品还是在线产品,都有版本的概念,比如webqq出过1.0,2.0和3.0版,离线软件的版本多的数不过来。一般的产品经理是不会在乎这个不起眼的小问题的,只有seo人员介入的时候,发现页面权重分散到无数个网页版本上时,才发现这... Continue reading

google各种服务被封,hosts设置

#GoogleCode66.249.89.104 code.google.com#GooglePlus(目前好用)203.208.46.29 plus.Google.com203.208.46.29 talkgadget.google... Continue reading

用ruby写一个简单的socket通信

服务器端s = TCPServer.open(19890722)while sock = s.acceptThread.new sock do |client| #多线程while str = client.gets #得到客户端信息... Continue reading

大量数据快速导入mysql的方法

当你有几千万行数据,N多个文件,需要导入mysql对应表的时候,可以试试这样做1.假设数据表只有id和string两个字段,其中string可以做一个unique索引,避免重复2.先建立好这些文件,用sed过滤一下特殊字符,用uniq... Continue reading

清理非中文字符的方法

总之就是用正则替换,察看utf-8编码范围其中cjk是chinese japan korean的意思,其中ideographs是“象形文字”的意思因此我就取其中u4E00 - u9FFF 这个范围(CJK unified ideogr... Continue reading

精彩的html5网站

西部牛仔题材。鼠标一直拖到右边就可以了。看完一节在右侧点鼠标。好像可以改情节。http://www.nevermindthebullets.com/strip.html#1-1输入你家地址,它会自动生成MVhttp://www.the... Continue reading

unicode之utf-8编码的表示方法

麻痹的,为了这一个问题搞了一个礼拜才算明白utf8编码一般有两种表示方法,u1234或者x12x34x56参考 http://en.wikipedia.org/wiki/Utf-8utf8是变长字符,可能是1个字节到6个字节,比如01... Continue reading

linux sed替换utf8字符的bug

经过上次的研究,郁闷的碰上了sed的一个bug,UTF8字符 9FA5~9FFF 在sed里做正则替换会报告sed: -e expression #1, char 31: Invalid collation character那么折中... Continue reading

linux环境下保证ruby单进程运行的方法(适用于所有语言)

做单进程目的是为了不停的用crond触发程序运行,而保持这个程序始终只有一个进程执行。因为,我用crond每分钟触发执行一次。即使程序若异常则退出,可以用crond再次保持其运行。若程序运行时间很长,会造成系统同时执行N个进程,造成内... Continue reading

vim常用设置

编辑/etc/vimrc文件,下面需要哪个就加进去syntax on “语法高亮set number “显示行号set hls “HighLight Search 标亮搜索到的词汇set is “Instant Search 随着输入... Continue reading

利用vim的宏录制功能批量给超链接增加nofollow的小技巧

由于中国的页面无用链接普遍较高,在修改页面模板的时候经常要批量增加rel=”nofollow”属性,这时候可以利用vim做到这点.(这是我第一次用到record功能,李炜你丫要是敢给我不期望的评论,必将遭到我的诅咒!!!)1.打开模板... Continue reading

发现了Dropbox的替代品:花生壳+ssh+rsync+淘汰的笔记本

家里的宽带基本都是包年或者包月,不利用浪费.测试的时候发现直接rsync会导致域名解析失败,不知道为啥,所以需要通过ssh.准备一个eeebox或者淘汰的笔记本,24小时开机,省电.装linux系统,装上打开sshd,rsyncd,c... Continue reading

如何做SEO

[这只是一个草稿,还需要细化.上个月去了上海参加一个搜索引擎营销会议,听了SEO部分才发现业内的水平如此之低,也许是故意放水吧.故有兴趣整理一份个人能想到的相对全面的SEO文档,以告诉大家什么是真正的SEO]如何做seo(以下搜索引擎... Continue reading