feat: lines macros

2019-01-20 19:04:12 +08:00 · 2019-01-20 19:04:12 +08:00 · ed762a8dd4
parent cc3d915877
commit ed762a8dd4
9 changed files with 105 additions and 75 deletions
--- a/Cargo.toml
+++ b/Cargo.toml
@ -5,3 +5,4 @@ authors = ["PoiScript <poiscript@gmail.com>"]
 [dependencies]
 jetscii = "0.4.3"
 memchr = "2"
--- a/src/elements/block.rs
+++ b/src/elements/block.rs
@ -15,13 +15,7 @@ impl Block {
        let mut pos = 0;
        let end = format!(r"#+END_{}", &src[8..name]);
-        while let Some(line_end) = src[pos..].find('\n').map(|i| i + pos + 1).or_else(|| {
+        for line_end in lines!(src) {
            if pos < src.len() {
                Some(src.len())
            } else {
                None
            }
        }) {
            if src[pos..line_end].trim().eq_ignore_ascii_case(&end) {
                return Some((
                    &src[8..name],
--- a/src/elements/dyn_block.rs
+++ b/src/elements/dyn_block.rs
@ -14,13 +14,7 @@ impl DynBlock {
            .is_ascii_alphabetic())?;
        let mut pos = 0;
-        while let Some(line_end) = src[pos..].find('\n').map(|i| i + pos + 1).or_else(|| {
+        for line_end in lines!(src) {
            if pos < src.len() {
                Some(src.len())
            } else {
                None
            }
        }) {
            if src[pos..line_end].trim().eq_ignore_ascii_case("#+END:") {
                return Some((
                    &src[8..name].trim(),
--- a/src/elements/list.rs
+++ b/src/elements/list.rs
@ -1,3 +1,6 @@
 use memchr::memchr_iter;
 use std::iter::once;
 pub struct List;
 macro_rules! ident {
@ -73,8 +76,8 @@ impl List {
        (beg, pos)
    }
-    // return (ident, is_ordered, end)
+    // return (ident, is_ordered, contents_end, end)
-    pub fn parse(src: &str) -> Option<(usize, bool, usize)> {
+    pub fn parse(src: &str) -> Option<(usize, bool, usize, usize)> {
        let bytes = src.as_bytes();
        let starting_ident = ident!(src);
@ -82,55 +85,46 @@ impl List {
            return None;
        }
        let mut lines = lines!(src);
        // skip the starting line
        let mut pos = lines.next().unwrap();
        let is_ordered = Self::is_ordered(bytes[starting_ident]);
        let mut pos = starting_ident;
        while let Some(i) = src[pos..]
            .find('\n')
            .map(|i| i + pos + 1)
            .filter(|&i| i != src.len())
        {
            let ident = ident!(src[i..]);
-            // less indented than its starting line
+        Some(loop {
            let mut curr_line = match lines.next() {
                Some(i) => i,
                None => break (starting_ident, is_ordered, pos, pos),
            };
            // current line is empty
            if src[pos..curr_line].trim().is_empty() {
                let next_line = match lines.next() {
                    Some(i) => i,
                    None => break (starting_ident, is_ordered, pos, pos),
                };
                // next line is emtpy, too
                if src[curr_line..next_line].trim().is_empty() {
                    break (starting_ident, is_ordered, pos, next_line);
                } else {
                    // move to next line
                    pos = curr_line;
                    curr_line = next_line;
                }
            }
            let ident = ident!(src[pos..curr_line]);
            // less indented than the starting line
            if ident < starting_ident {
-                return Some((starting_ident, is_ordered, i - 1));
+                break (starting_ident, is_ordered, pos, pos);
            }
-            if ident > starting_ident {
+            if ident > starting_ident || Self::is_item(&src[pos + ident..]) {
-                pos = i;
+                pos = curr_line;
                continue;
            }
            if bytes[ident + i] == b'\n' && pos < src.len() {
                let nextline_ident = ident!(src[ident + i + 1..]);
                // check if it's two consecutive empty lines
                if nextline_ident < starting_ident
                    || (ident + i + 1 + nextline_ident < src.len()
                        && bytes[ident + i + 1 + nextline_ident] == b'\n')
                {
                    return Some((starting_ident, is_ordered, ident + i + 1 + nextline_ident));
                }
                if nextline_ident == starting_ident {
                    if Self::is_item(&src[i + nextline_ident + 1..]) {
                        pos = i + nextline_ident + 1;
                        continue;
                    } else {
                        return Some((starting_ident, is_ordered, ident + i + 1 + nextline_ident));
                    }
                }
            }
            if Self::is_item(&src[i + ident..]) {
                pos = i;
                continue;
            } else {
-                return Some((starting_ident, is_ordered, i - 1));
+                break (starting_ident, is_ordered, pos, pos);
            }
-        }
+        })
        Some((starting_ident, is_ordered, src.len()))
    }
 }
@ -142,7 +136,7 @@ fn parse() {
 + item2
 + item3"
        ),
-        Some((0, false, 23))
+        Some((0, false, 23, 23))
    );
    assert_eq!(
        List::parse(
@ -151,7 +145,7 @@ fn parse() {
 * item3"
        ),
-        Some((0, false, 24))
+        Some((0, false, 24, 24))
    );
    assert_eq!(
        List::parse(
@ -161,7 +155,7 @@ fn parse() {
 - item1"
        ),
-        Some((0, false, 17))
+        Some((0, false, 16, 18))
    );
    assert_eq!(
        List::parse(
@ -169,7 +163,7 @@ fn parse() {
  2. item1
 3. item2"
        ),
-        Some((0, true, 28))
+        Some((0, true, 28, 28))
    );
    assert_eq!(
        List::parse(
@ -177,7 +171,7 @@ fn parse() {
 2) item1
  3) item2"
        ),
-        Some((2, true, 10))
+        Some((2, true, 11, 11))
    );
    assert_eq!(
        List::parse(
@ -185,7 +179,7 @@ fn parse() {
    1) item1
  + item2"
        ),
-        Some((2, false, 32))
+        Some((2, false, 32, 32))
    );
    assert_eq!(
        List::parse(
@ -195,6 +189,29 @@ fn parse() {
        ),
        None
    );
    assert_eq!(
        List::parse(
            r#" - Lorem ipsum dolor sit amet, consectetur adipiscing elit.
   - Nulla et dolor vitae elit placerat sagittis. Aliquam a lobortis massa,
     aliquam efficitur arcu.
   - Lorem ipsum dolor sit amet, consectetur adipiscing elit.
   - Phasellus auctor lacus a orci imperdiet, ut facilisis neque lobortis.
   - Proin condimentum id orci vitae lobortis. Nunc sollicitudin risus neque,
     dapibus malesuada sem faucibus vitae.
 - Sed vitae dolor augue. Phasellus at rhoncus arcu. Suspendisse potenti.
   - Nulla faucibus, metus ut porta hendrerit, urna lorem porta metus, in tempus
     nibh orci sed sapien.
   - Morbi tortor mi, dapibus vel faucibus a, iaculis sed turpis."#
        ),
        Some((1, false, 677, 677))
    );
 }
 #[test]
--- a/src/elements/mod.rs
+++ b/src/elements/mod.rs
@ -75,6 +75,7 @@ pub enum Element<'a> {
    List {
        ident: usize,
        is_ordered: bool,
        contents_end: usize,
        end: usize,
    },
 }
@ -135,14 +136,15 @@ impl<'a> Element<'a> {
                    || bytes[pos] == b'*'
                    || (bytes[pos] >= b'0' && bytes[pos] <= b'9')
                {
-                    if let Some((ident, is_ordered, list_end)) = List::parse(&src[end..]) {
+                    if let Some((ident, is_ordered, contents_end, end)) = List::parse(&src[end..]) {
                        ret!(
                            Element::List {
                                ident,
                                is_ordered,
-                                end: list_end
+                                contents_end,
                                end
                            },
-                            end
+                            0
                        );
                    }
                }
--- a/src/elements/rule.rs
+++ b/src/elements/rule.rs
@ -1,10 +1,14 @@
 use memchr::memchr;
 #[cfg_attr(test, derive(PartialEq))]
 #[derive(Debug)]
 pub struct Rule;
 impl Rule {
    pub fn parse(src: &str) -> usize {
-        let end = src.find('\n').map(|i| i + 1).unwrap_or_else(|| src.len());
+        let end = memchr(b'\n', src.as_bytes())
            .map(|i| i + 1)
            .unwrap_or_else(|| src.len());
        let rules = &src[0..end].trim();
        if rules.len() >= 5 && rules.chars().all(|c| c == '-') {
            end
--- a/src/lib.rs
+++ b/src/lib.rs
@ -1,5 +1,6 @@
 #[macro_use]
 extern crate jetscii;
 extern crate memchr;
 #[macro_use]
 mod utils;
--- a/src/parser.rs
+++ b/src/parser.rs
@ -37,6 +37,7 @@ pub enum Container {
    List {
        ident: usize,
        is_ordered: bool,
        contents_end: usize,
        end: usize,
    },
    ListItem {
@ -246,10 +247,12 @@ impl<'a> Parser<'a> {
                Element::List {
                    ident,
                    is_ordered,
                    contents_end,
                    end,
                } => self.stack.push(Container::List {
                    ident,
                    is_ordered,
                    contents_end: contents_end + self.off,
                    end: end + self.off,
                }),
                _ => (),
@ -333,7 +336,7 @@ impl<'a> Parser<'a> {
                    assert!(self.off <= end);
                }
                Paragraph { end, trailing } => {
-                    assert!(self.off <= trailing);
+                    // assert!(self.off <= trailing);
                    assert!(self.off <= end);
                }
                CenterBlock { contents_end, end }
@ -352,8 +355,7 @@ impl<'a> Iterator for Parser<'a> {
    type Item = Event<'a>;
    fn next(&mut self) -> Option<Event<'a>> {
-        //
+        // self.check_off();
        self.check_off();
        if self.stack.is_empty() {
            if self.off >= self.text.len() {
@ -395,8 +397,14 @@ impl<'a> Iterator for Parser<'a> {
                        self.next_ele(contents_end)
                    }
                }
-                Container::List { end, ident, .. } => {
+                Container::List {
-                    if self.off >= end {
+                    contents_end,
                    end,
                    ident,
                    ..
                } => {
                    if self.off >= contents_end {
                        self.off = end;
                        self.end()
                    } else {
                        self.next_list_item(end, ident)
--- a/src/utils.rs
+++ b/src/utils.rs
@ -112,10 +112,10 @@ macro_rules! starts_with {
 #[macro_export]
 macro_rules! skip_space {
    ($src:ident) => {
-        until!($src, |c| c != b' ').unwrap_or(0)
+        until!($src, |c| c != b' ' && c != b'\t').unwrap_or(0)
    };
    ($src:ident, $from:expr) => {
-        until!($src[$from..], |c| c != b' ').unwrap_or(0) + $from
+        until!($src[$from..], |c| c != b' ' && c != b'\t').unwrap_or(0) + $from
    };
 }
@ -154,3 +154,12 @@ macro_rules! parse_succ {
        );
    };
 }
 #[macro_export]
 macro_rules! lines {
    ($src:ident) => {
        memchr::memchr_iter(b'\n', $src.as_bytes())
            .map(|i| i + 1)
            .chain(std::iter::once($src.len()))
    };
 }