缘起
前几天发现一个电子书非常棒,但是是 github 上的,总是打不开,而正好我的服务器是在香港的,所以我想做一个镜像。下面给大家提供了两种方案,下面话不多说了,来一起看看详细的介绍吧。
方案一
做了如下配置:
1
2
3
4
5
6
7
8
|
location ^~ /book-c/ { proxy_pass http: //akaedu .github.io /book/ ; proxy_redirect off; proxy_http_version 1.1; proxy_set_header Upgrade $http_upgrade; proxy_set_header Connection "upgrade" ; } |
浏览了下,都 ok,但是有几点不太好
- 如果以后我发现类似的书很好,都要增加一个 nginx 配置。
- 如果原始网站完全无法访问了,我这边也挂了,不能缓存到我本地服务器。
- 我想修改网页内容也不太好操作,比如我想加上原作者的版权和原始访问地址说明等。
完全采集过来,我也懒得写脚本去跑,最终走上了下面这段踩坑路。
尝试改进
所以尝试了如下做法
1
|
rewrite ^/book-(.*?)/ /index.php?m=Book&a=show&book=$1 last; |
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
|
class BookAction extends Action{ private $uri; public function show(){ $book = $_GET['book']; if (!method_exists($this,$book)){ $this->error404(); } try{ $this->$book(); }catch (Exception $e){ $this->error404(); } } /** * http://akaedu.github.io/book/ */ private function c(){ $baseUrl = "http://akaedu.github.io/book/"; $url = $baseUrl.$this->uri; echo file_get_contents($url); } } |
又遇到了一个问题,当我访问 https://mengkang.net/book-c/styles.css 则无法 rewrite 匹配到了。
原因是 nginx 优先匹配了
1
2
3
4
|
location ~ .*\.(js|css)?$ { expires 12h; } |
正则匹配优先级关系:http://www.zzvips.com/article/38561.html
方案二
添加一条
1
2
3
4
|
location ~ /book-.*?/ { rewrite ^/book-(.*?)/ /index.php?m=Book&a=show&book=$1 last; } |
location ^~ 不支持正则的,所以没法用
采坑小记
如果是使用的 location ~ /book-.*/ ,根据正则就是贪婪模式,那么
https://mengkang.net/book-c/images/sortsearch.theta.png
匹配到的就是 /book-c/images/ ,也就是说rewrite里面的 $1 就是 c/images ,这样和我们的预期相悖的。
故障:无法匹配到 css 文件
1
2
3
4
5
6
7
8
9
|
$ wget -S https://mengkang.net/book-c/styles.css -O /dev/null --2018-02-01 13:13:36-- https://mengkang.net/book-c/styles.css Resolving mengkang.net... 203.195.188.207 Connecting to mengkang.net|203.195.188.207|:443... connected. HTTP request sent, awaiting response... HTTP/1.1 200 OK Server: nginx Date: Thu, 01 Feb 2018 05:13:38 GMT Content-Type: text/html; charset=UTF-8 |
所有内容的输出默认都是 text/html ,那么也就是我需要对文件的后缀判断咯。 感觉自己给自己挖坑,不如直接采集得了
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
|
<?php class BookAction extends Action{ const BOOK_SAVE_DIR = "/data/book/" ; private $uri ; private $baseUrl ; private $book ; private $bookname ; public function show(){ $book = $_GET [ 'book' ]; $this ->book = $book ; $this ->uri = str_replace ( "/book-{$book}/" , "" , $_SERVER [ 'REQUEST_URI' ]); if (!method_exists( $this , $book )){ $this ->error404(); } try { $this -> $book (); } catch (Exception $e ){ $this ->error404(); } } /** * http://akaedu.github.io/book/ */ private function c(){ $this ->baseUrl = "http://akaedu.github.io/book/" ; $url = $this ->baseUrl. $this ->uri; $this ->output( $url ); } private function output( $url ){ $ext = pathinfo ( $url ,PATHINFO_EXTENSION); if (! $ext ) { $url = $url . "/index.html" ; $ext = "html" ; } switch ( $ext ){ case "css" : header( "Content-Type: text/css; charset=UTF-8" ); break ; default : header( "Content-Type: text/html; charset=UTF-8" ); break ; } // 如果已经缓存 $filename = self::BOOK_SAVE_DIR. $this ->book. "/" . str_replace ( $this ->baseUrl, "" , $url ); if ( file_exists ( $filename )){ $data = file_get_contents ( $filename ); } else { $data = file_get_contents ( $url ); $dir = dirname( $filename ); if (! file_exists ( $dir )){ mkdir ( $dir ,755,true); } file_put_contents ( $filename , $data ); } // 增加原始版权说明 echo $data ; } } |
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对服务器之家的支持。
原文链接:http://mengkang.net/1152.html