• js分析页面停留时间及来源

    • 源代码如下:

      var second = 0;
      window.setInterval(function () {
          second ++;
      }, 1000);
      var tjArr = localStorage.getItem("jsArr") ? localStorage.getItem("jsArr") : '[{}]';
      $.cookie('tjRefer', getReferrer() ,{expires:1,path:'/'});
      window.onbeforeunload = function() {
          if($.cookie('tjRefer') == ''){
              var tjT = eval('(' + localStorage.getItem("jsArr") + ')');
              if(tjT){
                  tjT[tjT.length-1].time += second;
                  var jsArr= JSON.stringify(tjT);
                  localStorage.setItem("jsArr", jsArr);
              }
          } else {
              var tjArr = localStorage.getItem("jsArr") ? localStorage.getItem("jsArr") : '[{}]';
              var dataArr = {
                  'url' : location.href,
                  'time' : second,
                  'refer' : getReferrer(),
                  'timeIn' : Date.parse(new Date()),
                  'timeOut' : Date.parse(new Date()) + (second * 1000)
              };
              tjArr = eval('(' + tjArr + ')');
              tjArr.push(dataArr);
              tjArr= JSON.stringify(tjArr);
              localStorage.setItem("jsArr", tjArr);
          }
      };
      function getReferrer() {
          var referrer = '';
          try {
              referrer = window.top.document.referrer;
          } catch(e) {
              if(window.parent) {
                  try {
                      referrer = window.parent.document.referrer;
                  } catch(e2) {
                      referrer = '';
                  }
              }
          }
          if(referrer === '') {
              referrer = document.referrer;
          }
          return referrer;
      }
      
      
    • GitHub 发布 2019 年度透明度报告

    • GitHub 上周发布了 2019 年度的透明度报告(Transparency Report),主要是向公众告知其在 2019 年的用户信息披露和内容删除情况。简单来说就是介绍了如何以及向谁披露用户信息,和基于什么理由删除或屏蔽内容。GitHub 还表示,他们一直在尽可能严格地限制删除内容的行为,以此促进自由表达。

      报告显示,GitHub 在 2019 年被要求处理的数据主要包括以下三类:

      要求披露用户信息

      阅读剩余部分...

    • QueryList采集教程之【typecho列表页】规则

    • QueryList不依赖任何框架和架构,它可以单独使用也可以引入到任意的PHP开发框架中去使用,如:Laravel、ThinkPHP;你可以使用它来构建简单的采集系统,也可以用它才构建高可用的分布式采集系统。它提供了丰富的基于CSS选择器的页面抽取API,完全模块化的设计,拥有强大的可扩展性。

      QueryList 提供的一整套内容采集解决方案

      • DOM内容选择:CSS选择器
      • HTTP客户端:GuzzleHTTP
      • 内容过滤:CSS选择器
      • 解决乱码:内置多套乱码解决方案
      • 额外功能:丰富的扩展插件

      阅读剩余部分...

    • PHP对HTML标签转义及反转义

    • 我们通过WEB编辑器写好代码后,要写入到数据库,需要对特殊代码进行转义处理,我们使用PHP原生的htmlspecialchars()函数进行处理。

      $content=htmlspecialchars($content);
      

      在页面输出内容时,需要反转义再输出,这时候我使用html_entity_decode()函数进行处理

      $content=html_entity_decode($content);
    • PHP爬虫工具phpquery中文手册

    • php爬虫类phpqueryphpQuery是一个基于PHP的服务端开源项目,它可以让PHP开发人员轻松处理DOM文档内容。更有意思的是,它采用了jQuery的思想,使得可以像使用jQuery一样处理页面内容,获取想要的页面信息。

      1.引入phpquery类库

      include 'phpQuery/phpQuery.php'; 
      

      2.加载需要获取内容的网页连接或则文档

      阅读剩余部分...

    • (3种解决办法)获取微信公众号图片资源

    • 我们获得公众号文章里的图片素材URL后,由于微信使用了防盗链,所以显示不出照片,提示【此图片来自微信公众号平台,未经允许不可引用】,如何解决这个问题呢?

      解决办法1

      图片转由你的服务器代理输出, 图片地址改为your-domain.com/image-proxy?url=微信的图片地址,
      在你的服务端获取这个url地址,file_get_contents再输出,若仍显示防盗链就用curl 模拟header refer来获取数据输出

      解决办法2

      阅读剩余部分...

Powered by Typecho)))   ICP:蜀ICP备05009250号